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^ (54) Title: RECONHGURABLE ELEMENTS 

^ (54) Bczeichnung: REKONFIOURIBRBARE ELEMENTB 

(57) Abstract: The invention relates to a cell element field for data processing with function cell for canying out algebraic and/or 
^ logical functions and memoiy cells for the receipt, storage or giving out of information. Pertaining to the above, a control connection 
ff) is ran fiiOm the function cells to the memory cells. 

ft (57) Zusammenfassung: Die Erfindung betriflft ein Zellementefeld zur Datenverarbeitung mit Funktionszellen zur Ausfiihrung al- 
gebraischer und/oder logischer Funktionen und Speicheizellen, um Information zu empfangen, abzuspeichern und/oder auszugeben. 
1^ Hierbei ist voigesehen dass von den Funktionszellen eine Steuerveibindung zu den Speicheraellen gefUhrt ist. 
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Titel: Relconfigurierbare Blemente 



Deflnltionen 

20 Rekonfigurierbare Elemente werden abh^glg von der auszuftlhrenden i^pliJcatlon 
unterschiedlich und applikati onsen tsprechend ausgestaltet. 

Die Aufgabe der Erfindung besteht darin, Neues ftir die gewerbliche Anwendiing 
berei tzustellen . 



Die LOsung der Aufgabe wird unabhSngig beansprucht . Bevorzugte 
Ausftttirvingsformen finden sich in den TOteransprttchen . 



Unter einer relconfigurierbaren Architektur werden vorliegend Bausteine (VPD) 
30 mit konf igurierbarer Funktion und/oder Vemetzung verstanden, insbesondere 
integrierte Batisteine mit einer Mehrzahl von ein- Oder mehrdimensional 
angeordneten arithmetischen und/oder logischen und/oder analogen und/oder 
speichemden und/oder intern/extern vemetzenden Baugruppen, die direkt Oder 
durch ein Bussystem miteinander verbunden sind. 

35 

Zur Qattung dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mehrprozessor Systems, Prozessoren mit mehreren Rechenwerken 
und/oder logischen Zellen und/oder kommunikativen/peripheren Zellen (10) , 
Vemetzungs- und NTetzwerkbausteine wie z.B. Crossbar-Schalter, ebenso wie 
40 bekannte Bausteine der Oattung FPOA, DPGA, Chameleon, XPOTER, etc.. 

Hingewiesen wird insbesondere in diesem Zusammenhang auf die folgenden 
Schutzrechte und Anmeldungen desselben Anmelders: 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DE 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, DE 196 51 
075.9-53 , DE 196 54 846.2-53, DB 196 54 593.5-53 , DE 197 04 728.9, DE 198 

1 
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07 872,2 , DE 101 39 170.6 , DB 199 26 S38.0 , DE 101 42 904.5 , , DE 102 06 

653.1 , DE 102 06 857.7 , DE 100 28 397.7 , DE 101 10 530.4 , DE 102 02 

044.2 , DE 101 29 237.6-53 , DE 101 42 904.5 , DE 100 50 442.6 , DE 101 33 
210.7-53 , EP 02 001 331.4 , 60/317,876 • Dlese sind hiermit zu 

5 Of fenbarutngszwecken vollumfdnglich elngegliedert. 

Die o.g. Architektur wird beispielhaft z\ir Verdeutlichung herangezogen und im 
folgenden VPU genannt. Die Architektur besteht aus beliebigen arithmetischen, 
logischen (auch Speicher) und/oder Speicherzellen und/oder Vemetzungszellen 

10 und/oder koxnmunikativen/peripheren (10) Zellen (PAEs), die zu einer ein- oder 
mehrdimensionalen Matrix (PA) angeordnet sein k6nnen, wobei die Matrix 
unterschiedlicha, beliebig ausgestaltete Zellen aufweisen kann; auch die 
Bussysteme werden dabei als Zellen verstanden. Der Matrix als ganzes Oder 
Teilen davon zugeordnet ist eine Konf igurationseinheit (CT, Ladelogik) , die 

15 die Vernetzung \md Funktion des PA konfiguriert. Die CT kann z. B. als 

dedizlerte Elnheit gem. PACT05, PACTIO, PACT17, ausgestaltet sein Oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DB 102 06 856.9 dem PA 
zugeordnet bzw. mit oder durch solche realisiert sein. 

20 

Stand der Technik 

Onterachiedliche PAE- Strukturen sind nach dem Stand der Technik bekannt. Die 
gebrauchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 442.6 , sowie 
25 caiameleon CS2112 definiert. Weiterhin soil auf die bekannten FPGA-Zellen 
verwiesen werden. 

Aus dem universitaren Cftnfeld sind Zellstrukturen wie die DPQAs, RawMacdxine 
(DeHuon) , KressArrays (Kress, Uni Kaiserslautem) , XPOTER (fiartenstein, Dni 
30 Kaiserelautem) , sowie weitere Strukttiren bekannt. 

Die nachfolgend beschriebenen Erweiterungen, die ftir alle vorgenannten 
Strukturen nutzbar sind, verbessem die Nutzbarkeit der Architekturen und 
PAE-Strukturen in komplexen insbesondere auch stark sequentiellen und/oder 
35 wenig datenflufiorientierten Anwendungen. Weiterhin wird der AnschluE an 
exteme Einheiten (z.B. Speicher \ind/oder Peripherie) vereinfacht und 
honogenisiert. 



Indirekte Konf iguration 

In einer beeonderen Ausftthrung einer PAE (IPAE) wird diese oder eine Gruppe 
von PAEs mit einem Speicher (RRAM) , vorzugsweise .einer RAM-PAE gekoppelt. Die 
IPAE weist einen eigenen intemen Seguenzer auf oder ist mit einem Sequenaer 
45 bzw. Microcontroller mit einem bevorzugt limitierten, d,h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen mOglichen Befehlen, 
ahnlich wie bei RiSC-Prozessozren und/oder bevorzugt vollstandigen 

2 
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Befehlssatz (vgl. ARC Microprocessor) gekoppelt. Mit anderen Worten wird 
bevorzugt ein RISC Prozessor mit einem mOglichst kleinen Befehlssatz, der 
jedoch berechnungstheoretisch vollstandig ist, verwendet. In einer 
AuflfUhrungsvariante kann der Seguenzer auch dxirch eine Konf iguration einer 

5 Oder mehrerer PAEs gebildet warden. Es kann der Sequenzer in seiner Funktibn 
uad seinem Ablauf verbal ten konfigurierbar ausgestaltet sein (wie 
beispielsweise nach dem Stand der Technik bekannt, z.B. durch EPS448 von 
Altera [ALTERA Data Book 1993]). Der Sequenzer /Microcontroller kann auf 
Zustande <z.B. Status signale, Ereignisse) in der IPAE und/oder auf Zustande 

10 (z.B, auch Trigger) anderer PAEs, die mit der IPAB verbunden sind (z.B. (Iber 
ein Bussystem), reagieren. In einem Register der IPAE wird ein Pointer auf 
einen RRAM Speicherinhalt konfiguriert, z.B. kann der ProgramPointer Rpp 
kann wfihrend des Reset-Zyldus auf die Startadresse des Codes gesetzt werden. 
Ein Adressgenerator im Sequenzer liest den durch den Pointer referenzierten 

15 Speicherinhalt aus dem RRAM und schreibt diesen (oder einen Teil dessen) 
entweder in ein, beispielsweise durch den Speicherinhalt adresslertes, 
Konfigurationsregister einer adressierten PAE oder nutzt den Speicherinhalt 
als Instruktion fttr eine nachste Verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der tlblichen Arbeitsweise von Adresspointem 

20 inkrementiert tmd/oder dekrementiert und/oder bei Sprungbefehlen {OXJKP, CALL, 
RETORM) neu gesetzt. Insoweit stellt der Speicher RRAM einen Codespeicher und 
in einer bevorzugten Ausftlhrung auch Datenspeicher f(lr einen Sequenzer zur 
Verftig\ing und/oder wird als solcher genutzt. Der Sequenzer kann frei Code aus 
dem Speicher (RRAM) lesen und in einer bevorzugten AusfUhrung auch Daten aus 

25 dem Speicher lesen oder in den SpeicOier schreil>en. Insofem stellt der 
Speicher auch einen Datenspeicher ftbr den Sequenzer dar. 

Der RRAM Speicherinhalt kann von einer ttoergeordneteh Konf igurationseinheit 
(CT) geladen werden. In einer erweiterten AusfOhrung kann der Speicherinhalt, 
30 ggf . auch von der IPAE selbstandig. zusatzlich oder altemativ aus einem 

anderen (beispielsweise extemen) Speicher geladen oder an diesen geschrieben 
werden, z.B. tlber einen Anschlufi an ein Frontend. 

In einer Ausftthrungsvariante kann der Speicher und/oder die IPAE einen 
35 direkten Anschlufi (EXTBUS) an ein extemes RAM und/oder exteme 10 besitzen. 
In einer dabei besonders bevorzugten Ausgestaltung kaim der EXTBUS tiber eine, 
ggf. dedizierte, Verbindung des PAE-Bus systems an eine Interface-Baugruppe 
(lOAO) wie beispielsweise aus PACT03 oder PACT15 bekannt realisiert sein. Die 
Ansteuerung von i^eicher (RAM) und/oder Peripherie (10) erfolgt dabei 
40 bevorzugt durch die Interface-Baugruppe. 

In einer besonders bevorzugten Ausgestaltimg kann der RRAM selbstandig Code 
und/oder Daten fOr den Sequenzer (iber den EXTBDS aus dem oder einem extemen 
RAM laden. Diese Funktion kann durch eigenstSndige, im RRAM implement ierte 
45 Oder implementierbare Adressgeneratoren realisiert werden. Beispielsweise 

eignen sich DMA-Kontroller besonders fUr diese Aufgabe, indem sie blockweise 
Daten zwlschen den Speichem kopieren. Der Adressraum der zu lesenden Daten 
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und der ZieXadressraum wlrd entsprechend gesetzt und der Kopiervorgang wird 
gestartet. Das Setzen kann durch die IPAE erfolgen. 

In einer hardwaremaSig aufwendigeren Ii6s\jng kann die Function durch eine 
5 ■ implementierte MemoryManagemenUnit (MMO) realisiert sein, deren allgemeine 
Punktionsweiee durch den Stand der Technik per se definiert und bekannt ist. 
Vorliegend arbeitet die bevorzugte MMU hier wie folgtt 

Der von der mu verwaltete RRAM speicher ist in mehrere Seiten (Pages) 
10 aufgeteilt. Jede Page enthait Daten eines virtuellen Speicherraumes innerhalb 
eines extemen Speichers. Beispielsweise kOnnen die hexadezimalen RRAM- 
Adressen OxOaOO . . OxOaf £ Daten des extemen Speichers an den Adressen 
Oxbdl3200. .03dDdl32f£ enthalten. Zur Verwaltung der Adressuinsetzung wird eine 
Adresstibersetzungseinheit verwendet, die vorzugsweiee durch in der RRAM-Zelle 
15 vorgesehene Lookup-Tabellen realisiert ist. Die MMO ist nun dazu 

vorgesehen^insbesondere einen groSen Sfpeicherraum auf den sehr viel 
Kleineren des RRAM zu tibersetzen. Dies geschieht vorliegend derart, dass 
Seiten je nach Bedarf von dem grofien Speicherraum in den Kleinen kopiert 
werden. Sobald eine Seite nicht mehr benatigt wird, kann diese geKJscht 
20 und/oder titers chrieben werden. Wenn die Daten auf der Seite vertodert wurden, 
wird die Seite bevorzugt vor dem LOschen/Oberschreiben in den groSen 
Speicherrraum zurUckgeschrieben. 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein haherwertiger Teil 
25 der physikalischen Adresse (also die Adresse der Seite) in dem Lookup- 

Speicher abgelegt wird und auf die entsprechenden Daten der Seite im RRAM 

zeigt, sobald die Seite innerhalb des kleineix Speichers (RRAM) verfOgbar ist. 

Dadurch kann ein Zugriff auf die Seite erfolgen. Pehlt die Seite im RRAM, ist 

auch keine Referenz eingetragen. In diesem Fall muss die Seite erst von 
30 einem grofien (extemen) Speicherraum in den RRAM kopiert werden. Hierzu kann 

eine andere, bevorzugt aktuell ni<iht verwendete Seite gemftfi dem voretehenden 

Ablauf ttberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
35 durch den Seguenzer erfolgen, indem von der MMCr ein DMA-Kontr oiler 

angesteuert wird. Die erfindungsgemaSe MMD des hier offenbarten RRAM ist 
daher mit einer Ansteuerung fttr einen DMA-Kontroller versehen und/oder 
verbindbar. Diesem werden die entsprechenden Seitenadressen im RRAM und 
extemen RAM, sowie die SeitengrfiBe durch die MMU zur VerfUgung gestellt, z. 
40 B. indem sie in Register eingetragen werden. 

In einer mOglichen und applikationsabhftngig ggf . bevorzugten AusfOhrung 
kannen mehrere EXTBOS-Interface implementiert sein. 

45 

In einer mOglichen AusfOhrung ist der RRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente kannen 

4 
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beispielsweise fttr einige der folgenden Funktionen aufgeteilt sein bzw. 
aufteilbar sein und insbesondere eine QrGSe aufweisen, die. die 
Inrplementieriang aller Oder elniger der folgenden Funktionen ermOgllcht sowie 
entsprechende Steuerungen, die gegebenenfalls konfigurierbar eind, bevorzugt 
5 aber fest implementiert sind, besitzen: 

Sequenzer-/Code-Sp6icher, Stack (z.B. fOr Registereatz) , Datenspeichar, Heap, 
lO-Puffer, Puffer zu extemem RAM bzw. Cache, Lookup-Tabellen, 
Konfigurationen fUr PAEs und/oder Busse, der Registersatz der IPAE, 
Je nach Funktion kOnnen dazu folgende Ansteuermechanismen vorgesehen und/oder 
10 konfiguriert sein: 

Sequenzer-ZCode-Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Bpp) . 

Stack: Stackzeiger auf die oberste Speichers telle des Stack (Rsp), 
gegebenenf alls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
15 (z.B. Intel Pentium) per se bekannt ist. 

Konfigurationen fOr PAEs und/oder Busse: Hierauf kann ein Zeiger innerhalb 
der CT und/oder - iraplementierungsabhangig ein Zeiger innerhalb der 
KonfigurationsBteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAB im Speicher 
20 untergebracht sein, wird dieser direkt durch die PAE bevorzugt 
hardwaretechnisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche , wie Datenspeicher, Puffer, Tabellen etc. 
werden typischerweise und bevorzugt durch den Con?>iler oder Programmierer 
25 aufgebaut. Die Adressierung dieser Bereiche erfolgt durch das auszuftihrende 
Programm und/oder Betriebssystem und wird innerhalb des Programmes und/oder 
Be triebssys terns, ggf . unter Zuhilfenahme der Registers at zes und der ALU des 
Sequenzers, berechnet. 

30 Der Registersatz der IPAE kann in einer besonderen Ausgestaltung ahnlich dem 
Registersatz von Transputem als Stack organisiert sein. Dadurch kann der 
Registersatz besonders klein und hardware technisch effizient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 
der Transputertechnologie bekannt, dass Coirpiler effizient mit einem 

35 derartigen hardwaretechnisch kostengtostigen Registersatz arbeiten kannen, 
Bbenfalls kann der Registersatz optional im RRAM liegen. 

In einer Ausftihrung kann und wird der RRAM als Multi-Port Speicher ausgeftihrt 
sein. Multi-Port Speicher erlauben den ggf. auch gleichzeitigen Schreib- 
40 und/oder Lese-Zugrif f durch mehrere Speicherzugriffseinheiten auf den 
Speicher inhalt. Speicherzugriffseinheiten kOnnen beispielsweise exteme 
und/oder interne Peripherie, Prozessoren, andere PAEs sein. Die Funktion von 
Multi-Port Speichem ist nach dem Stand der Technik ebenfalls bekannt. 

45 In einer besonderen Ausftihrung kann die IPAE mit dem RRAM als lokale und ggf. 
auch globale Konfigurationseinheit ahnlich einer CT fttr PAEs in der Utagetoung 
arbeiten oder unter anderem diese Funktion mit erf alien. Bevorzugt arbeitet 

5 
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die PAE nach dem aus DE 196 54 846.,2-53 bekannten Verfahren bet der 
Verwendung als lokal Konf ig\irationseinheit. Wird die PAE als globale 
Konf igurationseinheit verwendet, Oder sind sehr viele^ lokale PAEs zu 
konfigurleren, wird bevorzugt das Verfahren nach DB 196 54 593.5-53 

5 verwendet, das eine FILMO-Funktionalitat aufweist und daher sehr viele und 
auch voneinander xinabhangige Konfigurationea verwalten kann. 
Die IPAB adressiert, z. B. gesteuert durch den Sequenzer/ Microcontroller, 
Konf igxirationen im RRAM und konfiguriert diese an PAEs und/oder sich selbst 
' und/oder bestimmt den Ablauf des Sequenzers/Microcontrollers . Bevorzugt 

10 f indet hierbei eine Synchronisation mit einer flbergeordneten CT ^litih der 
bekannte Inter -CT- Pro tokolle (DE 198 07 872.2, DE 100 28 397.7 , DE 199 26 
538.0 ) statt. Die IPAE RHAM Schaltung kann Konf iguration tiber eines der 
EJCTRAM-Interface selbst laden und/oder Konfigurationen von einer 
Ubergeordneten CT tiber das CT Interface anfordem. Die Puttktionsweise kann 

15 ahnlich der Rekonf igurationseinheit in DB 196 54 846.2-53 sein. Die 
Konfigurationsdaten fto die PAEs werden durch die IRAM an die PAEs 
weitergeleitet Oder in einer bevorzugten Ausgestaltung direkt von RRAM. Zur 
Auf teilung der Daten im RRAM an mehrere PAEs kaim dabei ein 
Busverteilverfahren ahnlich des in DB 101 10 530.4 beschriebenen SIMD- 

20 Bussystems verwendet werden. 

Mit anderen Worten ist die prinzipielle Arbeitsweise einer XPAE RRAM 
Verschaltung ahnlich einem Microcontrollersy-stem, dessen Busanbindung 
und/oder dessen Datentransf er und/oder dessen Programmablauf einem VPU-System 
25 entspricht. 

Es wird insbesondere Schutz ftir IPAE-RRAM-VerschaXtungen beansprucht, bei 
denen die IPAE und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonf igurlerbaren Bausteins ausgestaltet sind und typischerweise 
30 beliebige Verschaltungen und Funktionen ausftihren kOnnen, aber jedoch 

speziell zum Einsatz der erf indungsgemflfi beschriebenen Sequenzerstruktur aus 
IPAE und RRAM entsprechend konfiguriert und verwendet werden k^nnen. Die 
Konf iguration erfolgt dabei bevorzugt durch die libergeordnete 
Konf igurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht ftir PAEs, die zusatzlich zu ihrem Anschluss 
an die intemen Bussysteme des Arrays aus PAEs einen dedizierten Anschluss 
(10-Channel) an ein Uberregionales Bussystem aufweisen, das insbesondere 
Daten tiber lange Strecken innerhalb des Arrays tibertragt und/oder 

40 insbesondere direkten Anscshlufi an die Peripherie aufweist. Der Anschlufi an 
die Peripherie kann dabei direkt erfolgen, indem z. B. das Bussystem bereits 
dpm peripheren Protokoll entspricht oder tiber entsprechende Protokollwandler 
zur Otasetziang des Protokolls erfolgen. Das dedizierte Bussystem kann dabei 
bereits einem Indus tries taudard entsprechen, z. B. PCI, RapidIO, Firewire, 

45 USB, Ethernet, RAMBUS, DDR-RAM etc. um somit einen einfachen und 

unaufwendigen Anschluss der peripheren Gerfite zu ermttglichen. Qegebenenfalls 
kCnnen auch in zwischengeschalteten lOAOs (vgl. DB 196 54 595.1-53 ) 

6 
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Protokollkonvertierungen derart durchgeftihrt werden. so dase ein internes 
vereinfachtes vmd ggf . proprietares Busprotokoll auf ein Oder mehrere 
komplexere exteme Standardprotokolle tibersetzt warden. 
Es soli besonders darauf hingewiesen warden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgezfihlten Busprotokollen 
verdeutlicht wird. 

EbenfalXs ist erf indungsgemafi besonders relevant, dass PAEs auch mehrere 
AnschlUsse an dedizlerte Bussysteme aufweisen k6nnen. 

10 

Desweiteren sind anwendungsabhangig auch Architekturen sinnvoll, bei denen 
nvir eine Teilmenge der PAEs Anschlttsse an ein dediziertes Bussystem aufweist, 
Oder unterschiedliche PAEs mit einer unterschiedliaien Anzahl von AnschlOasen 
an ggf. auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 

Im folgenden wird eine detaillierte Beschreibung einer Ausftihrungsvariante 
der erfindungsgemafien Kopplung von IPAB und RRAM ausgeftlhrt: 

Es wird erf indungegemafi bei einem in Funktion und/oder Vemetzung 

20 insbesondere zur Lauf zeit ohne StOrxing nicht zu rekonf igiirierender Elemente 
rekonf igurierbaren Zellelementef eld zur Datenverarbeitung mit Punktionszellen 
zur AusfOhrung algebraischer und/oder logischer, konfigurierbarer Punktionen 
und Speicherzellen, um Informationen zu empfangen, abzuspeichem und/oder 
auszugeben vorgeschlagen, daS eine Steuerverbindung (CMD) von den 

.25 Punktionszellen zu den Speicherzellen gefflhrt ist. Diese Steuerverbindung 

dient dazu, die Adress- und/oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Punkt ions z ell e, typisch einer ALU-PAE, steuerbar zu roachen^ So 
kann etwa angegeben werden, ob die nachste Ubertragene Information als 
Adresse oder als Daten beliandelt werden soil und ob ein Lese- und/oder 

30 Schreibzugriff erforderlich ist. Diese DatenUbertragung aus der 

Speicherzelle, bei der es sich etwa um eine RAM-PAB handeln kann, auf die 
ALa-PAE erlauben dann, daS neue, von der ALU abzuarbeitende Befehle in diese 
geladen werden kfinnen. Es ist auf diese Weise mOglich, lediglich durch 
Vorsehen einer dedizierten und dediziert funktionszellenkontroXlierten 

35 steuerverbindung zwischen Funktionszelle \md Speicherzelle bereits mit nur 
zwei Elementen, die ttber geeignete Busse verbunden sind, eine 
Sequenzerstruktvir in einem Zellelementefeld aufzubauen, ohne dafi ansonsten 
weitere Mafinahmen und/oder bauliche Veranderungen erforderlich sind. In der 
Speicherzelle kOnnen Daten, Adressen, Programmschritte usw. in per se aus 

40 herkOmmlichen Prozessoren bekannter Weise abgelegt werden. Weil beide 

Elemente auch in anderer Weise bei entsprechender Konf iguration einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Sequenzerstrukturen als auch vektoriellen und/oder pa- rallelisierbaren 
Strukt\u:en besonders gut anpaiSbar ist. 

45 

Es ist einsichtig, daS durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementefeld, namlich der Funktionszelle und der 

7 
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Infortnationsbereitstellxingszelle eine Vielzalil von sequenzerartigen 
Strukturen in dem rekonf igiirierbaren Zell element ef eld aufgebaut werden kaim. 
Dies 1st insofem vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in 
einem multitaslcingfahigen Betriebssystem, eine Reihe \mterscbiedlieher und 
5 voneinander per se verschiedener Aufgaben abgearbeitet werden mufi. Es kOnnen 
dann eine Vielzahl derar tiger Aufgaben in einem einzlgen Zellelementefeld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile £Qr 
Echtzeitanwendungen sind of fensichtlich. Weiter ist es auch mOglich, die 
einzelnen Sequenzerstrukturen, die in einem Zell- elementefeld unter 
Vorsehung der erfindungsgemafien Steuerverbindung aufgebaut werden, mit 
unterschiedlichen Taktraten zu betreiben, etwa um den Stroiwerbrauch dadurch 
zu senken, daS Aufgaben mit geringerer Prioritat langsamer abgearbeitet 
werden. Es ist Uberdies mOglich, bei der AusfOhrung per se weitgehend 
paralleler Algorithmen sequenzerartige Programmteile in dem Feld parallel 
Oder vektoriell abzuarbeiten und umgekehrt. 

Das Zellelementefeld mit den in F\mktion und/oder Vemetzung konf igurierbaren 
Zellen kann einsichtigerweise einen Prozessor, einen Coprozessor und/oder 
einen Mikrocontroller bilden, bzw. eine parallele Vielzahl oder Konibinationen 
derselben. 

Die Funktionszellen sind typisch als arithmetische Iiogikeinheiten gebildet, 
wobei sie insbesondere grobgranulare Elemente darstellen, die aber rait einer 
feingranularen Statemachine versehen sein kOnnen. In einem besonders 
bevorzugten Ausfflhrungsbeispiel handelt es sicb bei den ALUs urn sogenannte 
erweiterte ALUs (EALU), wie diese in den frtiheren Anmeldungen des 
vorliegenden Anmelders beschrieben wurden. Eine Erweiterung kaim insbesondere 
die Steuerleitungskontrolle, BefehlsdekodiereixOieit etc. umfassen, soweit 
erforderlich. Es soil darauf hingewiesen werden, dass grundsatzlich zumindest 
eine Teilmenge der Funktionszellen auch aus feingranularen FPOA-Elementen 
aufgebaut sein kann. 

Die Speicherzellen kOnnen Da ten und/oder Informationen f Itlchtig und/oder 
nichtfltichtig speichem. Wenn in den Speicherzellen abgelegte Informationen, 
seien es Programmschritte, Adressen ftir einen Zugriff auf Daten oder 
registerartig bzw. heap-artig abgelegte Daten als flttchtige Daten abgelegt 
sind, so kann eine vollstandige Rekonfiguration wahrend des Betri^bes 
erfolgen. Altemativ ist es m«5glich, nicht flttchtige Speicherzellen 
vorzusehen. Die nichtflttchtigen Speicherzellen kOnnen etwa als EE-Prom- 
Bereich und dergleichen vorgesehen werden, in die ein rudimentftres Bios- 
Progratnm abgelegt wird, das bei Inbetriebnahme der Anordnung auszuftthren ist. 
Auf diese Weise kann ohne weitere Bauteile eine Inbetriebnahme einer 
Datenverarbeit\ingseinrichtung erfolgen. Ein nichtflUchtiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und /der Raxamgrttnden 
beschlossen wird, dafi immer wieder dieselben Programmteile auszufOhren sind, 
wobei dann auch \inter solchen f esten Prograromteilen, etwa nach Art der WAVE- 
Rekonfiguration, im Betrieb gewechselt werden kann. Die MOglicOikeiten, 

8 
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derartige nichtfiachtige Spelcher vorzusehen \md zu verwenden, sind 
Gegenstand anderer Schutzrechte des Anmelders. Es ist mttglich, sowohl 
f lachtige als auch nichtfltichtige Daten in den Spelcherzellen abzuspeichern, 
etwa uxn eln Bios-Progranrni fast abzulegen und die Speicherzelle dennoch fttr 
5 andere Zwecke nutzen zu kttnnen. 

Die Speicherzelle ist bevorzugt so ausgebildet, daS sie eine hinreichende 
Vielzahl von zu verarbeitenden Daten und/oder abzuarbeitenden Prograiranteilen 
speichern kann. Es sel dabei darauf hingewiesen, dafi diese Prograinmtelle 

10 sowohl als Prograimnschritte ausgebildet sein kSnnen, die jeweils vorgeben, 
was eine einzelne, insbesondere die zugeordnete PAE, also insbesondere die 
die Speicherzelle steuemde Punktionszelle, ira nftchsten Schritt zu tun hat, 
als auch ganze Konfiguratlonen fttr Peldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne weiteres mOglich, da& die aufgebaute 

15 Sequenzerstruktur einen Befehl ausgibt, auf Grund dessen eine Rekonf iguration 
von Zellelementefeldbereichen erfolgt. Damlt arbeitet die diese Konf iguration 
auslSsende Punktionszelle dann zuglei6h als Ladelogik (CT) . Es sei darauf 
hingewiesen, dafi die Konf iguration von anderen Zellen wiederum dergestalt 
erfolgen kann, dafi dort eine sequenzerartige Datenverarbeitung erfolgt und es 

20 ist in diesen Peldem wiederuia mOglich, andere Zellen im Verlauf der 

Prograiraaarbeitung zu konf igurieren bzw. rekonfigurieren. Damit ergibt sich 
ein iteratives Konfigtirieren von Zellelementebereichen und ein Blnschachteln 
von Prograramen mit Seguenzer- und Parallel-Strukturen, die ahnlich ineinander 
geschachtelt sind wie eine Babuschka. Es sei darauf hingewiesen, dafi hier 

25 insbesondere durch Ein-Ausgabezellen ein Zugrif f auf weitere 

Zellelementefelder aufierhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenleistung inassiv erhdhen kann. Es ist insbesondere 
mOglich, bei Auftreten von Konfigxirationen in einem Codeteil einer in ein 
Zellelementefeld hinelnkonfigurierten Sequenzerstruktur gegebenenfalls 

30 entweder die Konfigurationsanf orderungen auf einem zugewiesenen 

Zellelementefeld, das von der jeweiligen Sequenzerstrukt\ir allein verwaltet 
wird, durchzufOhren und/oder es kOnnen dereortige Anf orderungen an eine 
Konfigurations-Mastereinheit abgegeben werden, urn sicherzustellen, da£ eine 
gleichmasige Belegung aller Zellelementefelder erfolgt. Es ergibt sich eomit 

35 quasi ein TKiterprogrammaufruf durch tJbergabe von erforderlichen 

Konfigurationen an Zellen oder Ladelogiken. Dies wird fttr sich als 
schutzwUrdig angesehen. Es sei auch darauf hingewiesen, dafi die Zellen » 
eofem sie selbst fttr die Konf iguration anderer Zellelementfeldbereiche 
Zustandigkeit besitzen, mit hard- oder softwareartig implementierten FILMO- 

40 Strukturen und dergleiehen zur sicherstellung einer ordnungsgeroaSen 

Rekonfiguration versehen sein kOnnen. Auf die MSglichkeit, die Spelcherzellen 
wahrend der Abarbeitung von Befehlen derart zu beschrelben, dafi sich der 
abzuarbeitende Code bzw. das abzuarbeitende Programm todert, sei hingewiesen. 
In einer besonders bevorzugten Variante ist diese Art der Selbstmodifikation 

45 (SM) aber durch eine entsprechende Steuerung Ober die Punktionszelle 
unterdrUckt. 
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Bs ist mOglich, dafi die Speicherzelle aljgespeicherte Information hier auf die 
Ansteuerung der sie steuemden Funktionszelle direkt oder indirekt auf einen 
zur Funktionszelle fOhrenden Bus gibt. Die indirekte Ausgabe kann 
insbesondere dann erfolgen, wenn beide Zellen benachbart liegen und die durch 

5 Ansteuerung angef orderte Information an die ALU-PAE iiber ein Bussegment 
eintref f en mufi, das nicht unmittelbar mit dem Ausgang der Speicherzelle . 
verbunden werden kann. In einem solchen Pall kann die Speicherzelle Daten auf 
dieses Bussystem insbesondere ttber Rticlcwarts register (Backward-Register) 
ausgeben. Es ist daher bevorzugt, wenn zumindest eine von Speicherzelle 

10 und/oder Funktionszelle ein seiches Backward-Register aufweist, welches im 
Infonnationsweg zwischen Speicherzelle und Funktionszelle angeordnet werden 
kann, Diese Register brauchen in einem solchen Fall nicht zwingend mit 
weiteren Funktionalitaten versehen sein, obwohl dies etwa bai Anforderung von 
Daten aus der Speicherzelle fOr die weitere Verarbeitung, entsprechend einem 

15 herkttmmlichen LOAD-Befehl eines typischen Mikroprozessors, zur Verflnderung 
der Daten noch vor dem Hineinladen in die PAB ohne wei teres denkbar ist, um 
z. B. einen Befehl IiOAD++ zu realisieren. 

Mit anderen Worten werden innerhalb der beschriebenen Struktur 
Busverbindungen bei Bedarf durch die in der XPP-Technologie des Anmelders 

20 typischen Forward ( FREO ) - xmd Backward (BREO) -Register geftihrt. Diese besitzen 
die MOglichkeit Daten zwischen horizontal en Bussystemen vertikal zu 
tibertragen und kdnnen mehrere Busse miltiplexen oder deraultiplexen. Der 
Vollstandigkeit halber sein darauf hingewiesen, dass FREQ und BRBG (entgegen 
ihrer Namensgebung) nicht zwangsiauf ig Regis terstuf en darstellen, sondem 

25 lediglich optional und ggf . konfigurierbare Register aufweisen. 

Die Steuerverbindung (CMD) kann dabei an FREO und/oder BREO der jeweiligen 
Funktionszellen (PABs) geftihrt werden, um die Busdatentransfers entsprechend 
des aktuell ausgefOhrten Befehls zu steuem. 

30 Die Speicherzelle wird bevorzugt dazu angeordnet sein, Informationen von der 
sie steuemden Funktionszelle zu empfangen, wobei auch weiter ein 
Informationseinspeichem tlber eine Bin-Ausgabezelle und/oder eine die 
Speicherzelle nicht steuemde Zelle mOglich ist. Insbesondere dann, wenn 
Daten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 

35 sollen, ist es bevorzugt, wenn auch diese Ein-Ausgabezelle (I/0~PAE) von der 
Funktionszelle gesteuert wird, Dabei kann etwa die Adresse, bei welcher eine 
in die Speicherzelle zu schreibende oder gegebenenfalls auch direkt an die 
Funktionszelle (PAE) zu Obertragende Information zu lesen ist, an die I/O-PAE 
von der ALU-PAE abermittelt werden. Es sei in diesem Zusammenhang darauf 

40 hingewiesen, daS diese Adresse Ober eine AdrefiObersetzungstabelle 

(Adresstranslationtable) , einen Adresstranslationbuf f er oder eine MMU-artige 
Struktur in der I/O-PAE festgelegt werden kann. Es ergeben sich insbesondere 
in einem solchen Fall die vollen Funktionalitaten typischer Mikroprozessoren. 

45 Die Punktionszellen-Speicherzellenkombination ist demnach in einer 

bevorzugten Variante zumindest ein Ein-Ausgabe-Mittel zugeordnet, mit welchem 
dann an eine exteme Einheit, eine andere Funktionszelle, Funktionszellen- 

10 
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Speicherzellen-Kom-bination und/oder Speicherzellen Information gesandt 
und/oder von dieser exmpfangen werden kann. 

Die Ein-Ausgabe-Elnheit wird dabei toevorzugt glelchfalls zum Bnpfang von 
5 Steuerbefehlen aus der Funktionszelle ausgeblldet. 

Die Funktionszellen-SpeicherzellenTcombination waist bevorzugt 
DatentransfermtJglichkeiten an die tibrigen Funktionszellen und/oder 
Speicherzellen eines VP0-Bausteines auf , insbesondere solchen, die sich im 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif fsmOglichkeiten tlber die 
Bussysteme auf die entsprechenden Zellen zur Verfflgung gestellt. Der Zugriff 
erfolgt bevorzugt Uber die Forward- und/oder Backward-Register der PAEs der 
Funktionszellen-Speicherzellenkonbination, durch die Obertragung der -Port"- 
Steuerkoxnmandos . 

15 

In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, zumindest einige \md bevorzugt alle der nacbfolgenden 
Steuerkommandos zu Qbertragen: 

20 

OPCODE FETCH, 

II3TERNE/EXTEBNE DATENZUQRIFFE, 

POSITIONIERUNG VON INTEHNEN/EXTERNEN ADRESSPOINTERN, 
POSITIONIERUNG VON INTERNEN/EXTERNEN PROGRAMMPOINTERN, 
25 PROGRAMMPOINTER INCREMENT, 

POSITIONIERUNG VON INTERNEN/EXTERNEN STACKPOINTERN, 
STACKZUGRIPFE (PUSH, POP) 

Belspielsweise kann diese Funktionalitat durch folgende CMD Steuerkominandos 
30 inqplementiert werden: 





load^const: 


Lade eine Ronstante in ein Register 




writeuJRap: 


Setze Adress Pointer fOr Speicherzugrif fe 






(z. B. Heap) 




readJRap : 


Lese Adress Pointer fttr Speicherzugrif fe 


35 




(z. B. Heap) 




readwReg : 


Lese ein Register aus dem Speicher (wenn Register in der 






RAM-PAB ixiqplementiert sind) 




write_Reg: 


Schreibe Daten in ein Register im Speicher (wenn Register 






in der RAM-PAE ixQplementiert sind) 


40 


wri te&decr_Rsp : 


Schreibe ein Datenwort auf den Stack und dekrementiert 






den Stackpointer 




read&incr..J^p : 


Lese ein Datenwort vom Stack und inkrementeiere den 






Stackpointer 




set^pp : 


Setze Prograrnn5>o inter 


45 


set&push^pp: 


Schreibe Prograxnnipointer auf Stack und setze 






Prograinnqpointer neu 
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Die SteuerkoRimandos dienen der Steuerung der angeschlossenen Speicherzellezi 
und Funktionszellen (PAEb) . Weiterhin steuern die Steuerkoinmandos den 
Datentxansfer auf den Bussystemen, belsplelsweise durch Ansbeuerung von 
Multiplexern, Switches, Transmission Gates, o. a. in den Forward- und 
5 Backward-Registem (PRBG/BREG) . Weitere Befehle sind z. B.: 

read^ortt Lese Daten von einem Port (beispielsweise implementiert 

durch ein FREG) zum Array 
write_Port: Schreibe Daten auf einen Port (beispielsweise 

implementiert durch ein BRBG) zum Array 

10 

Dies kann durch eine entsprechende Bitbreite der Steuerleitung und eine 
zugeordnete Decodierung bei den Eit^££Lngem erfolgen. Die jeweiXs 
erforderlichen Steuer- und Dekodiermittel k5nnen problemfrei und 
kostengtinstig vorgesehen werden. Wie ersichtlich, ergibt sich mit den 
15 Signalen eine praktisch vollsttodige Sequenzerfahigkeit der Anordnimg. Da& 
auf diese Weise eine Allgemeinzweckprozessordatenverarbeitungseinheit 
erhalten wird, sei erwShnt. 

Die Anordnung wird typisch so gewdhlt sein, daS die Ftinktionszelle als 
20 alleiniger Master auf die Steuerverbindung und/oder ein als Steuerverbindimg 
dienendes Bussegment bzw. Bussystem zugreifen kann. Es ergibt sich soznit eine 
Anordnung, bei der die Steuerleitung als Command-Lei tung wirkt, wie sie in 
herkOmmlichen Prozessoren vorgesehen ist. 

25 Die Punktionszelle und die Speicherzelle bzw. I/O-Zelle sind bevorzugt 

benachbart angeordnet. XJnter benachbart kann dabei wie bevorzugt verstanden 
werden, dafi die Zellen unmittelbar nebeneinander angeordnet sind. Altemativ 
befinden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und Speicherzellen in Nachbarschaf t zueinander sorgt dafUr, daS keine, 

30 jedenfalls keine signif ikanten Latenzzeiten zwischen Ansteuerung und 

Dateneingang der ange£orderten Information in der Punktionszelle auftreten, 
nur weil die Verbindungen zwischen den Zellen zu lang sind. Dies sei als 
,direkt» verstanden. MUssen Latenzzeiten bertlcksichtigt werden, so kann auch 
ein Pipelining in den Sequenzerstrukturen vorgesehen werden. Dies wird 

35 besonders wichtig bei sehr hoch getakteten Anordnungen. Ee eei darauf 

hingewiesen, dafi es ohne weiteres mOglich ist, entsprechend hochfrequent 
getaktete Zelleinheiten vorzusehen, die wie im Stand der Technik per se 
bekannt, auch entsprecshend schnell auf geeignete Speicherzellen zugreifen 
k5nnen. Auch in einem solchen Pall, etwa wenn per se bekannte 

40 Architekturelemente ftir die Funktionszellen verwendet werden, wird 

gleichzeitig eine Rekonfigurierbarkeit des Funktionszellenelementes \ind der 
zugehOrlgen Verne tzungen vorzusehen sein. In einer besonders bevorzugten 
Variante sind die Funktionszellen, die Informationsbereitstellungszellen wie 
Speicherzellen, I/O-Zellen und dergleichen multidimensional angeordnet, 

45 insbesondere nach Art einer Matrix bzw. auf Gitterpunkten eines 

eindimensionalen Gitters usw. Wenn eine regelmSLfiige Stiniktur vorliegt, wie 
dies dort der Fall ist, wird einer Zelle typisch aus einer ersten Reihe 
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Informationi das helfib Operanden, Kon£lguratlonenr Triggersignale usw. 
zugeftihrt, wShrend in einer daninterliegende Reihe Daten, Triggersignale und 
andere Xnformationen abgegeben werden. In einem solchen Fall wird es 
bevorzugt seln, werni die Zellen in ein und derselben Reihe liegen und es kann 
5 dann der Informations transfer aus der Infonnationsbereitstel lungs zelle in den 
erforderlichen Eingang der Funktionszelle IXber ein Baclcward-Register 
erfolgen. Die Httglichlceit, die Register ftlr Pipelining zu benutzen, sei 
erwdhnt. 

10 Es wird weiter Schutz beansprucht ftlr ein Verfahren zum Betrieb eines 

Sellelementefeldes, insbesondere multidimensionalen Zellelementefeldes mit 
Funktionszellen zur Ausftihrung algebraischer und/oder logischer FunJctionen 
und Inforxnationsbereitstellungszellen, insbesondere Speicberzellen und/oder 
Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen und/oder 

15 Speichem derselben, wobei zumindest eine der Funktionszellen Steuerbef ehle 
an zumindest eine Inforraationsbereitstellungszelle ausgibt, dort im 
Ansprechen auf die Steuerbefehle Information fttr die Funkt ions zelle 
bereitgestellt wird und die Funktions zelle dazu ausgebildet ist, die weitere 
Datenverarbeitung im Ansprechen auf die bereitgestellte Information 

20 durchzufUhren, um so sequenzereurtig Daten zu verarbeiten. 

Es wird also in einem rekonf igurierbaren Feld durch die Ausgabe der 
Steuerbefehle an die Speicherzelle einer Sequenzerstruktur eine 
seguenzerartige Datenverarbeitung enndglicht. Die Befehle, die als 
Steuerbefehle von der Funktions zelle ausgegeben werden k6nnen, ermOglichen 
dabei einen seguenzerartigen Betrieb, wie er aus herkttinmlichen Prozessoren 
bekaxmt ist. Es sei darauf hingewiesen, daS es ohne weiteres mdglich ist, nur 
Telle der genannten Bef ehle zu implementieren und dennoch ^ne vollst&idig 
seguenzerartige Datenverarbeitung zu gewahrleisten. 

Die vorstehende AusfUhrungsvariante wird im folgenden noch einmal \md 
beispielsweise anhand der Zeichnungen beschrieben. In dieser ist gezeigt 
durch: 
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ein erflndungsgemaSes Zellelementefeld, 


Fig. 


2a 


ein Detail hiervon, 


Fig. 


2b, c 


das Detail von Fig. 2a wShrend verschiedener 






Datenverarbei tungs z ei ten , 


Fig. 


3a 


eine alternative Aus ftihrungs form des Details 






von Fig. 2, 


Fig. 


3b 


eine besonders bevorzugte Variante des 






Details. 


Fig. 


4 


Grundaufbau einer Funkbions-ZSpeicherzelle 






(PAE) 


Fig. 


5 


eine Ausgestaltungsvariante von Fig. 3b 
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Nach Fig. l(a/b) umfafit ein allgemein mlt 0101 bezelchnetes Zellelementefeld 
zur Datenverarbeitung 0101 Funktionszellen 0102 zur Ausftlhrung von 
arithmetischen und/oder logischen Fxinktionen sowie Speicherzellen 0103, um 
Infozinationen zu empfangen, abzuspelchem und/oder auBzugeben, wobei eine 
5 Steuerverbinduuag 0104 von Funktionszellen 0102 zu den Speicherzellen 0103 
geftihrt 1st. 

Zunachst wird die Arbeiteweise von Fig. la beschrleben. Fig. lb stellt eine 
bevorzugte Ausgestaltung und Anordung der Funktionszellen und Speicherzellen 
10 dar. 

Das Zellelementefeld 0101 ist in der Vemetzung der Elemente 0102, 0103, 0104 
frei konfigurierbar, und zwar ohne den laufenden Betrieb nicht neu zu 
konfigurlerehder Zell element eteile zu sttiren. Dabei kOnnen die Verbindungen 
konfiguriert werden, indem Bussysteitie 0105 wie erforderlich geschaltet 

15 werden. Welter sind die Funktionszellen 0102 in ihrer jeweiligen Funktion 
konfigurierbar. Bei den Funktionszellen handelt es sich um aritfametische 
Logikeinheiten, die um bestimmte, Rekon figuration ermOglichende Schaltkreise 
erweitert sind, wie Stateroachines, Scbnittstellenbeschaltung zur 
Xommunikation mlt der bevorzugt auSerhalb des Zellelementefeldes angeordneten 

20 Ladelogik 0106 usw. Auf die entsprechenden Voramneldungen des Anmelders wird 
hingewiesen. 

Die Zellelemente 0102, 0103 des Zellelementefeldes 1 sind zweidimensional in 
Reihen und Spalten angeordnet, wobei jeweils eine Speicherzelle 0103 

2S unmlttelbar neben einer Funktionszelle 0102 liegt und hler je Reihe drei 

Spei Cher zell en- Funktionszellen- Paare vorliegen, in denen die Funktions- und 
Speicherzellen jeweils tiber Steuerverblndungen 0104 miteinander verbunden 
sind. Die Funktions- und Speicherzellen 0102, 0103 weieen Singange auf, die 
mit dem Bussystem oberhalb der Reihe, in der sich die jeweiligen Zellelemente 

30 verbindbar sind, um Daten davon zu empfangen. Welter weisen die Zellen 0102, 
0103 Ausgtfnge auf, die auf das Bussystem OlOS unterhalb der Reihe Daten 
ausgeben. Wie noch eriautert werden wird, ist tiberdies Jede Speicherzelle 
0103 mit einem RUckwartsregister (BW) versehen, durch welches Daten von dem 
Bus xmterhalb einer Reihe auf den Bus oberhalb der jeweiligen Reihe 

35 durchgeschleust werden kOnnen. 

Mit Ausnahme der Steuerverblndungen 0104 und der zugeordneten Schaltungen 
innerhalb der Funktionszellen (ALU in Fig. 2) bzw. Speicherzellen (RAM in 
Fig. 2) handelt es sich bei dem Zellelementefeld zur Datenverarbeitung von 

40 Fig. 1 torn ein herkammliches Zellelementefeld, wie es bei rekonfigurierbaren 
Datenverarbeitunsanordnungen, beispielsweise einer VPU entsprechend der XPP- 
Technologie des Anmelders gebrauchlich und be3cannt ist. insbesondere kaxm das 
Zellelementefeld von Fig. 1 wie bekannt betrieben werden, weist also 
entsprechende Beschaltungen zur Wave-Rekonfiguration, zum Debugging, 

45 f)bertragen von Triggersignalen etc. auf. 
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Die Besonderheiten des Zellelementefeldes der vorXiegenden Erf indung ergeben 
elch aus der Steuerverbindiing 0104 und der zugehOrigen Beschaltting, die 
nachfolgend naher beschrieben warden wird mlt Bezug auf die Fig. 2a-c. Ea aei 
dabei erwahnt, dafi, wfihrend in Fig. 1 eine Steuerverbindung 0104 stets von 

5 einem weiter links liegende Funktionszellenelement zu einer weiter rechte 
liegenden Speicherzelle geftlhrt ist, und zwar nur und genau zu einer solchen 
Spelcherzelle, es einleuchtenderweise xnOglich ist, auch fOr die 
Steuerleitungen eine konf igurierbare Veametzung vorzusehen, um entweder an 
anderer Stelle liegende Speicherzellen anzusprechen und/oder um ggf . mehr als 

10 eine Speicherzelle ansprechen zu kOnnen, wenn etwa in grofiem Utafange 

Speicherl5edarf fOr Informationen besteht, die von den Speicherzellen zu 
empfangen, abzuspeichem und/oder auszugeben ist. Aus GrOnden der 
t)bersichtlichkeit wird aber in Fig. 1 und 2 lediglich auf fest vorgesehene 
einzelne Steuerverbindungen Bezug genoramen, was das Verstandnis der Erfindung 

15 wesentlich erleichtert. Die Steuerverbindvmg ist im tibrigen 

erforderlichenfalls durch herkOnttnliche Leitungen, enteprechende Protokolle 
vorausgesetztf stabs tituierbar. 

In Fig. 2 ist die Funktionszelle 0102 als ALU und die Punktionszelle 0103 als 
RAM bezeichnet. Oberhalb der Reihe, in der die Zellen liegen, veriauft der 
Bus 0105a, der das bereits erwahnte Backward-Register 0103a mit den Eingtogen 
0103b der Speicherzelle und 0102b der ALU verbindet. Das unterhalb der Reihe 
verlaufende Bussystem ist mit 0105b bezeichnet und es sind von dem Bussystem 
0105a, 0105b nur die relevanten Segmente gezeichnet. Es ist erkennbar, daS 
das Bussystem 0105b altemativ Daten erh£llt aus einem Ausgang 0102c der ALU 
0102, einem Ausgang 0103c des RAM 0103 und dafi es Daten in den Bingang 0103al 
des Backward-Registers fOhrt. 

Die ALU 0102 welst zugleich weitere Ein- und AusgSnge 0102al, 0102a2 auf, die 
30 auf andere Bussegmente geschaltet sein kdnnen und Ober welche die ALU Daten 
wie Operanden enqpfSngt bzw. Brgebnisse ausgibt. 

Die steuerverbindung 0104 befindet sich dauerhaf t \mter der Kontrolle der 
erweiterten Schaltkreise der ALU und stellt hier eine Verbindung dar, 01>er 
welche eine Vielzahl von Bits tibertragen werden kann. Die Breite der 
Steuerverbindung 0104 ist dabei so gewahlt, dafi zumindest die zuvor 
beschreibenen Steuerbef ehle an die Speicherzelle und die Forward/Backward- 
Register (FRBO/BREG) tibertragen werden kOnnen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherberelche auf, namlich einen sog. Stack- 
Bereich, einen Heap-Bereich und einen Programm-Bereich . Jedem Bereich ist 
dabei ein eigener Zeiger zugeordnet, tlber den bestiinmt ist, auf welchen 
Bereich des Stacks, des Heaps und des Prograinmbereiches jewells lesend oder 
schreibend zugegriffen wird. 

45 Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in Fig. 2b eine 
Situation gazeigt, in welcher aus dem Ausgang 0102a2 der ALU-PAB Daten Ober 
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das Baclcward-Register auf den Eingemg der RAH-Zelle gesazidt werden kdnnen, 
wohingegen der zeitgleich bestehenden, wenngleich nicht benutzten Verbindung 
zwischen dem Ausgemg 0103 c des RAM zum Bus 0105b tind der Verbindung zwischen 
dem Ausgang des Backward-Registers BW zum Eingang 0102b der ALU-PAE zum 
5 Zeitpunkt von Fig. 2b keine Bedeutung zukommt, weshalb diese gestrichelt 
angedeutet sind. In Fig. 2c ist hingegen ein Zeitpunkt gezeigt, zu welchem 
die Speicherzelle 0103 tlber ihren Ausgang 0103c aus dem tiber Steuerleitung 
0104 bestimmten Speicherbereich Stack (0203), Heap (0202), Program (0201) die 
Information (User das Backward-Register an den Eingang 2b der AIjU-PAE 0102 
10 speist, vahrend der Ausgang der ALO-PAE 0102c inaktiv ist und am Eingang 
0103b der RAM-PAB kein Signal enpfangen wird. Aus diesem Qrund slnd die 
entsprechenden Verbindungen strichpunktiert und somit als inaktiv 
dargestellt. 

15 Innerhalb der RAH-Zelle 0103 ist eine Schaltung 0103d vorgesehen, in der die 
tiber die Steuerleitung 0104 bzw. das Steuerleitungsbussegment 0104 eaqpfangene 
Information decodiert wird* 

Die AusfOhrungsvariante der Erfindung wird verwendet wie folgt; 

20 

Zundchst enpftogt die ALU 0102 Konf igurationsinformation von einer zentralen 
Iiadelogik, wie im Stand der Technik bereits bekannt. Die 

Inforaiationstibertragung kann in per se bekannter Weise unter Verwendung des 
RDY/ACK-Protokolls und dergleichen geschehen. Auf die MZJglichkeit, bei der 
25 Ladelogik einen FILMD-Speicber usw. vorzusehen, um eine ordnungsgem&fie 
Konfiguration der Anordnung zu ermOglichen# wird hingewiesen. 

Mit den Daten fttr die Konfiguration der ALU 0102 wird zugleicb eine Reihe von 
Da ten aus der Ladelogik ilbertragen, die ein sequenzerartig cibzuarbeitendes 

30 Programm darstellt. Dieses Prograxnm kann entweder bereits das zur Berechnung 
bzw. Ausftihrung der Applikation auszufUhrende Programm sein, oder einen rs 
Urlader (Boot) darstellen, der erst das auszufUhrende Applikationsprogramm 
von einer extemen Einheit (Speicher, Peripherie) ISldt. Das Laden des 
Programmes kann entfallen, wenn ein Tell des der ALU zugeordneten Speichers 

35 nichtflttchtig (z. B. ROM, EPROM, EEPROM, Flash-ROM) ausgestaltet ist und ein 
Urlader Oder das AppXikationsprogramai dort fest gespeichert ist. Dies kann 
insbesondere dann von Vorteil sein, wenn die Applikation vorab bekannt ist 
und unab&aderlich gestaltet werden kann, da eine feate In^lementieriing dann 
zu einer erheblichen Xostenreduktion ftihren kann. Die ALU gibt deshalb 

40 wahrend ihrer Konfiguration auf der Leitung 0104 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schrelben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der Ladelogik bei der ALU 
empf angene Daten tiber den Ausgang 0102c tiber den Bus OlOSbl und das Backward- 
Register 0103a gespeist und gelangen von dort in den Eingang 0103b der RAM- 

45 PAE 0103. von der Einheit 0103d werden entsprechend des Steuerbefehls auf 
Steuerleitung 0104 dann Daten auf den angewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich, bis sSmbllche, von der Ladelogik bei der 
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Konfigurabion empfangenen Programmteile In der Speicherzelle 0103 abgelegt 
sind. Wenn dann die Konfiguration der ALU beendet ist, wird diese durch 
Ausgabe der entsprechenden Befehle auf der Steuerleitung 0104 die nachsten, 
von Ihr sequenzerartlg abzuarbeitenden Programmschrltte anfordem und tiber 
5 den Ausgang 0103c, den Bus 0105b, das Baclcward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihrem Eingang einpfangen. wahrend der Prograimnabarbeitung 
kSnnen dabei Situationen auf treten, bei denen SprOnge innerhalb des 
Programmapeicherbereiches erforderlich sind, Daten in die ALU-PAE aus der 
RAM-PAE geladen werden, Daten im Stack abgelegt werden xnUssen usw. Die 

10 diesbeztigliche Koramunikation zwischen ALU-PAE xind RAM-PAE erfolgt Ober die 
Steuerleitung 0104, so dafi die ALU-PAE zu jedem Zeitpunkt die Dekodierung 
durchftihren kann. Oberdies k6nnen auch, wie bei einem herkOznmlichen 
Hikroprozessor, Daten aus einem Stack Oder einem anderen RAM-Speicherbereich 
einp£angen werden und es kdnnen tUderdies Daten von auSerhalb als Qperanden in 

IS der ALU-PAE empfangen warden. 

Es findet dabei die Abarbeitung der Programmsequenz statt, die in den RAM-PAE 
durch die Ladelogik vorkonfiguriert wurde. In der ALU-PAE wird dabei 
zugleich, wie per se erforderlich, eine Befehlsdekodierung vorgenonuaen. Dies 
20 geschieht mit den per se gleichen Schaltkreisen, die schon fUr die 

Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird tiber die ALU zu jedem Zeitpunkt die Steuerleitung 0104 kontrolliert, 
so dafi die RAM-Zelle stets genau die Art des Speicherzugriff es befolgt, die 
25 von der ALU vorgegeben ist. Auf diese Weise ist sichergestellt, dafi 

ungeachtet der Zeitimiltiplex-Benutzung der Buselemente 0105a, b jederzeit den 
in der Seguenzerstruktur vorhandenen Elementen vorgegeben ist, ob auf den 
Bussen Adressen ftir zu holende und/oder zu schreibende Daten oder Codes 
liegen Oder ob und gegebenenfalls wohln Daten zu schreil>en sind etc. 

30 

Die in Bezug auf Fig. 2 gezeigte Anordnung kann auf unterschiedliche Arten 
erweitert oder verSndert werden. Besonders relevant sind die in Pig. 3a xind 
3b dargestellten Varianten. 

35 Nach Fig. 3a ist zur Verbindung von oberen und unteren Bussen nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondem es sind auch ein 
Vorwarts-Register an der RAM-PAE und Vorwarts- und Rttckwarts-Register an der 
ALU-PAE vorhanden. Diese k{5nnen, wie durch die Mehrfach-Pf eile angedeutet, 
dazu dienen, von anderen Einheiten, wie extemen Hosts / extemen Peripherie- 

40 Qeraten wie Festplatten, Hauptspeicher und dergleichen und/oder von anderen 
Seguenzerstruktur en, PAEs, RAM-paes etc. Daten zu einpfangen und an diese zu 
senden. Wenn ein entsprechender Anforderungsbefehl fOr neue Prograramteile aus 
der Seguenzerstruktxur, die durch die ALU-PAE tind die RAM-PAE gebildet ist, 
abgesandt wird, ist es mOglich, PrograminblCcke in der Seguenzerstruktur 

45 abzuarbeiten, die weit gr6Ser sind als jene, die in der RAM-PAB speicherbar 
sind. Dies ist insbesondere bei koxnplexen Datenverarbeitxmgsaufgaben, 
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SprOngen Qber weite Bereiche, Insbesondere in Unterprograxmne usw. von 
masslvem Vorteil . 

Eine noch welter bevorzugte Variante ist in Fig. 3b gezeigb. Hier 
5 kommiiniziert die ALTJ-PAE nicht nur mit einer RAM-PAE, sondern zugleich' mit 
einer Znput/Outpub-PAB, die dazu ausgebildeb ist, eine 

Schnittstellenbeschaltung ftlr die Koxnmunikation mit extexnen Bauelexoenten 
vorzusehen, wie Festplatten, anderen XPP-VPUs, fremden Prozessoren und 
Coprozessoren usw. Wiederum ist die ALU-PAE die Einheit, die als Master far 
10 die als «CHD* bezeichnete Steuerverbindimg arbeitet und wiederum werden die 
Busse in Multiplex-Weise verwendet. Auch hier kann eine Obertragxang von Daten 
von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Backward-Register er£olgen. 

15 Die in Fig. 3b gezeigte Anordnung ermttglicht es, exteme Zugriffe auf nicht 
in der Speicherzelle RAM-PAE abspeicherbare Infonnationen besonders leicht zu 
gestalten und ermOglicht damit eine Anpassung der Sequenzerstruktur an 
bestehende, herkOmroliche CPU-Technologien und deren Betriebsverfahren in noch 
starkerem SDaEe insoweib, als nun in der Eingabe-Ausgabezelle 

20 AdressUbersetzungsmittel, Speicherverwaltungseinheiten (MMO-Funktionen) imd 
dergleichen implementiert sein kCiuien. Die RAM-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Bs sel darauf hingewiesen, daS mehrere Sequenzerstrukturen gleichzeitig in 
25 ein und dasselbe Feld hineinkonfiguriert werden Ic&nnen, dafi Funktionszellen, 
Speicherzellen und ggf . Ein-Ausgabezellen wahlweise ftlr Sequenzerstrukturen 
und/oder eine fOr die XPP-Technologie herkdmmliche Weise konf iguriert werden 
kdnnen und dafi es ohne weiteres mOglich ist, dafi eine ALU an eine andere AL0 
Daten ausglbt, die diese in einer Sequenzer -Weise konf igurieren und/oder zum 
30 Teil eines Zellelmentefeldes machen, mit dem eine bestimmte Konfiguration 
abgearbeitet wird. Auf diese Weise wird dann gegebenenfalls auch die 
Ladelogik entb^urlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kem 
35 einer PAE, typlscherweise bestehend aus einer oder mehreren ALUs und/oder 
einem Speicher und/oder FPGA-Blementen erhait Daten von dem Bussystem 0105a 
und tSbertragt die Ergebnisse der Datenverarbeitung an das Bussystem 0105b. 
Neben dem Kem sind die Forward-Register (FREG, 0402) und Backward-Register 
(BREG, 0403) angeordnet und tlbertragen Daten von 0105a nach 0105b (FREO) bzw. 
40 von 0105b nach 0105a (BREO) .BREG und FREG kOnnen el>ehfalls eine oder mehrere 
ALUs und/oder einem Speicher und/oder FPGA-Elementen enthalten^ Bevorzugt 
sind diese jedoch in ihrem Funktionsumfang gegentiber dem Kem (0401) 
eingeschr&nkt . 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
45 ttbertragung von Daten {DATA) und ein Bussystem zur Obertragung von Trigger, 
also statussignalen (TRIGGER) untertellt. 
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Die Konf iguration der PAE erf olgt durch eine Obergeordnete 
Konfigurationseinheit {z, B. eine CT) , die tlber einen Konf igurationsinis 
(0404) Konfigurationsworte an die PAE tlbertragt. Diese werden in 
Konf igurationsregistem gespeichert (0405) . Optional )cann ein 
5 Konfigurationsstack (0406) nach PACT17 und wie nachfolgend beschrieben 

zvischen den Konfigurationabus (0404) iind die Konfigurationsreglster (0405) 
zwischengeschaltet sein. 

Der Konfigurationsstack Jcann Daten und/oder bevorzugt Trigger von den 
Bussystemen 010S(a/b) einpfangen und an diese senden. 

10 

Die PAE kann optional einen Anschlufi an ein dediziertes Bussystem (10- 
Chaxinel, 0407) aufweisen. Zur Steuerung des Bussystems ist dem Kern (0401) 
eine zusatzliche Bussteuereinheit (0408) zugeschaltet. Ober den lO-Cbannel 
kan die PAE direkt xnit einein globalen, ggf . auch extemen Speicher und/oder 
15 Peripherie und/oder anderen PAEs Daten Obertragen. 

In einer bevorzugten Ausgestaltung besteht die MCglichkeit Konstanten fttr die 
Datenverarbeitung tiber 0404 zu setzen. In einer weiteren Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeiteregistem 
20 auslesen. 

Pigur 4 kann auch eine entsprechende RAM-PAE darstellen. Ober 0404 kann dann 
von einer CT die Vemetzung und Funktion des RAMs eingestellt werden. 
Die Funktion umfaSt beispielswiese folgende Funktionen oder Kombinationen 
25 daraus : 

1. Random Access 

2. FIFO 

3 . Stack 
30 4. Cache 

5. Page Mexaory fUr KMUs 

Desweiteren kann in einer bevorzugten Ausftihrung der Speicher mit Daten von 
der CT vorgeladen werden (z. B. Konstanten, 
35 Lookup-Tabellen, etc.), Ebenfalls kann die CT in einer erweiterten AuafUhrung 
Daten (z. B. zum Debuggen oder ftlr Taskwecheel) aus dem Speicher Ober 0404 
zurUcklesen. 

In einer bevorzugten Ausftthrung kann eine RAM-PAE mehrere Anschltlsse an das 
Bussystem 0105 aufweisen (dual -port oder multi-port) , wodxirch mehrere 
40 Daten transfers gleichzeitig durchgefUhrt werden kOnnen. 

In einer weiteren Ausftthrung kaim die RAM-PAE einen dedizierten AnschluS an 
einen extemen Bus aufweisen. 

RAM- PAEs kOnnen derart zusainmengeschaltet werden, dass aus mehreren (n) RAM- 
PAEs ein n-fach grOfierer Speicher entsteht. 

45 
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Figur 5 zeigt eine Ausgestaltungsvariante des Seguenzere nach Pigur 3b. Die 
ALU-PAB weist einen minimalen Registersatz Ra, Rb, Rx auf , der in diesem 
Beispiel lediglich zur Pufferung der Operanden und Ergebnisse dient. Der 
eigentliche Registersatz liegt in der RAM-PAE (RO..Rn). Ebeafalls ixinerhalb 
5 der RAH-PAE liegen die Register 
Rpp: Prograinm Pointer 

Rap: Adresa Pointer fOr Datenzugrif £e (z.B. Heap) 

Rsp: Stack Pointer fUr Stackzugrif £e 

Rfp: Frame Pointer zur Sichertmg des Stack Pointers 

10 bei lAiterprograminaufrufen 

Der CMD-Bus wird von der ALU-PAB gesteuert und Obertragt die 
Ablaufinformation des Sequenzers an s&ntliche beteiligten PAEs, sowie FREG 
und BREO zur Steuerung der DatenUbertragung au£ den Bussystemen (DlOSa, 
15 0105b) . 

Die RAM-PAB weist in diesem Ausgestaltungsbeispiel einen dedizierten XO- 
Cannel (0501) auf, Ober welchen sie ggf . auch selbststandig (z. B. ttber DMA- 
Kontroller) Daten von Oder zu peripheren Einheiten (z.B. 10, Speicher) 
tibertragen kann. Es soli nochmals darauf hingewiesen werden, dass auch die 
20 AL0-PABS einen solchen dedizierten AnschluS aufweisen kiJnnen oder in einer 
weiteren Aiisgestaltungsvariante die ALU~PA£ anstatt der RAM-PAE einen 
derartigen AnschluS besitzen kOnnte. 

Optional sind eine oder mehrere Datenaustauschvorrichtungen mit den 
restlichen Zellen des PAs (z. B. Punktions- und/oder Speicher zellen) 

25 implementiert. (Jber Eingabe-Ports (0502) kSnnen Daten von dem PA gelesen 
warden und liber Ausgabe-Ports (0503) ke5nnen die Daten ausgetauscht werden. 
Die Port werden beispielsweise Ober die CMD-Steuerkommandos read^ort und 
write_port angesteuert und schalten die Bussysteme entsprechend. Mit den 
Steuerkommandos wird ein Selektor Qbertragen, der anzelgt welcher Port durch 

30 das Steuerkonnnando angesprochen ist. 

Die vorliegend o££enbarte Lage der Register innerhalb der RAM-PAE ist 
ungewOhnlich, bietet aber zwei erhebliche Vorteile: 

a) Speicher zellen kttnnen £Ur die Register verwendet werden. 

b) Die Pointer liegen direkt in der RAM-PAE, wodurch Datenzugri££e auf den 
35 Speicher besonders echnell werden. Desweiteren ist ftlr sflmtliche Speicher- 

Zugri££e nur ein Bus auf dem Bussystem 0105 notwendig, wobei der 
normalerweise zusatzlich erforderliche Adressbus entfSlllt, da die Adressen 
lokal in der RAM-PAE durch die Pointer gegeben sind. 

Diese Anordnung wird daher als vom Anmelder bevorzugt typisch implementiert. 

40 

Pttr sSbntliche Da ten transfers ist die Lage der Register zu beachten. Um 
lediglich raOglichst einfache Befehle im Sequenzer zu iitqplementieren, sind 
daher besondere Befehle z\ir Regis termanipulat ion vorgesehen: 
moveta Rrr; L£ldt das Register Rrr (rr € {l..n, sp, ppr 
45 fp, ap)) nach Ra 

xnovetb Rrr: Ladt das Register Rrr nach Rb 
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movefx Rrr: Schreibt das Register Rx nach Rrr 

Um den Datenf luficharacter der AE#U zu wahren, ist bevorzugt ein weiterer 
besonderer Opcode implement iert: 
5 feed: tlbertragt Daten von Ra/Rb nach Rx, ohne diese 

zu manipulieren. 

Nachfolgende Beiepiele verdeutlichen die Arbeitsweise des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Ergebnis nach Register R2: 
10 moveta Rl; movetb R2; add; movefx R2; 

Schiebe Register R4 nach Register R7: 
moveta R4; feed; movefx R7; 

tibertrage R5 auf Stack: 

moveta R5; feed? push; 
Anmerkung: push Obertragt Daten des Registers Rx an die Speichers telle auf 
die Rsp zeigt und delcrementiert (bzw. inkexmentiert) Rsp. 

Setze Adresspointer Rap mit der indirekten Adresse R4 addiert zu R7 : 
moveta R4; movetb R7; add; movefx Ra; 

Lade Daten aus Speicherstelle Rap nach Rl: 

load; feed; movefx Rl; 
Anmerkung: load tlbertragt Daten von der Speicherstelle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet, z. B. von Adresse 0x0 bis 0x7 (fUr n = 7). Register werden 
beispielsweise angesprochen, indem beim Auftreten des entsprechenden CMD 
Steuerkommandos (z. B. read^reg, writejreg) die Registemummer mittlbertragen 
wird, diese als Adresse an den Speicher ttbertragen wird und die hdherwertigen 
Adressbits mit 0 gefttllt werden. 

Die Startadresse fOr den Code ware dann beispielsweise 0x8 (also Ox(n-i-l)) r 
worauf dann der Prograrampointer Rpp nach einem Reset zeigen wUrde. 
Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondem in 
gesondert implementierten Regis tern untergebracht, um eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu ermbglichen. 

In Figur 5b ist eine Architekturv€u:iante mit Regis tersatz innerhalb der ALU- 
PAE dargestellt. Die umstflndlichen Register trans feroperationen entf alien 
damit, wodurch diese Variante auch erheblich scluieller in der 
Datenverarbeitung ist. Allerdings ist sind die Hardwarekosten hOher, da der 
Registersatz zusatzlich iniplementiert werden muss und ftlr samtliche 
Speicherzugrif fe die Adressen von der ALU-PAE an die RAM-PAE Obertragen 
werden mUssen. 



21 



wo 03/036507 



PCT/EP02/10572 



RAMoverPAE 

Die nachfolgend beschriebene besondere Auegeataltung einer ALU-PAE (im 
Folgenden mit ROP-PAE bezel chnet) eigne t sich besonders fUr VPUs, deren 
Applikatlon irregulars sequentielle Codes aufweisen, die auf laeine 
5 Datenmengen in einer weitgehend ungeordneten Reihenfolge zugreifen. 

Zur Realisierung dieser Aufgabe wird in eine AIiU-PAE Speicher integriert 
(Integrated RAM = IRAM) , auf den die ALU direkten Schreib/Lese-Zxigrif f 
besitzt. Die ALCT ist entsprechend um eine Adressverwaltungsschaltung 
10 erweitert. Insbesondere k6nnen daher PABs nach dem vorstehend beschriebenen 
Aufbau (IPAEs) verwendet werden, wobei der separate RRAM ggf . entfailt und 
durch den integrierten IRAM ersetzt ist Oder der RRAM zusatzlich zum intemen 
IRAM quasi als Speichererweiterung vorgesehen ist. 

15 In einer besonders bevorzugten Ausftihrung ist ein Sequenzer bzw. 

Microcontroller mit einem bevorzugt limitierten aber bevorzugt vollstandigen 
Befehlssatz (vgl. ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitung sequentieller Codes ermOglicht. In einer weiteren 
Ausfahrungsvariante kann der Sequenzer in seiner FunJction und seinem 

20 Ablauf verbal ten auch konf igurierbsu: ausgestaltet sein (wie beispielsweise 

nach dem Stand der Technik bekannt, z.B. diirch EPS448 von Altera [ALTERA Data 
Book 19931 ). Der Sequenzer/Microcontroller kann auf Zustande (z.B. 
Status signals, Ereignisse) in der ROP-PAE und/oder auf Zustande (z. B. auch 
Trigger) anderer PAEs die mit der ROP-PAE verbunden sind {z.B. ilber ein 

25 Bussystem) reagieren. 

Der Sequenzer /Id. crocontroller liest seine Prograiranbef ehle aus dem IRAM. 
Die Zugriffe auf das Bussystem des Arrays (PA) entsprechen den tlblichen PAEs, 
ebenso die Oenerierung, der Empfang und die Weiterleitung von Statussignalen 
(Trigger nach PACT08) . Mehrere Busanbindungen fUr Da ten- und Triggereingtoge 

30 und fttr Da ten- und Triggerausgflnge kannen vorgesehen sein. 

Die ROP-PAE kann Operanden vom Bus lesen ggf, mehrzyklisch Verarbeiten und 
das Ergebnis wieder auf den Bus schreiben. 

In die ROP-PAE ist in einer bevorzugten Ausgestaltmg ein Regis tersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaltung Shnlich 

35 des Registersatzes von Transputem als Stack organisiert, Dadurch kann der 
Registersatz besonders klein und hardware technisch eff izient realisiert 
werden (typischerweise reichen 3 Register A, B \md C aus). Weiterhin ist aus 
der Transputer technologic bekannt, dass Compiler eff izient mit einem 
derartigen hardware technisch kostengtlnstigen Registersatz arbeiten k(5nnen. 

40 Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer bevorzugten Ausftihrung besitzt die ROP-PAE direkten AnschliiE 
(BXTBUS) an ein extemes RAM und/oder exteme 10. Es kttnnen 

applikationsabhangig mehrere EXTBUS vorgesehen sein. In einer dabei besonders 
45 bevorzugten Ausgestaltung kann der BXTBUS Ober eine, ggf. dedizierte, 
Verbindiing des PAE-Bussys terns an eine Interf ace-Baugruppe (I0A6) wie 
beispielsweise aus DE 196 54 595.1-53 oder DE 102 06 653.1 bekannt 
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realisiert sein. Die tasteueriing von Speicher (RAM) und/oder Peripherie (10) 
erfolgt dabei durch die Inter face-Baugruppe. 

In einer bevorzugten Ausftlhrung kann die ROP-PAE und dabei bevorzugt das IRAM 
5 direkt selbstandig Adressen ftlr das externa RAM vind/oder die exteme 10 
und/oder andere interne Speicher (RRAM/IRAM) generieren und exteme oder 
interne Daten transfers selbstandig steuem. Diese Funktion kann durch 
eigenstandige im RRAM iit«)leinentierte Adressgeneratoren realisiert werden. 
Beispielsweise eignen sich DMA-Kontroller beaonders ftlr diese Aufgabe, indem 
10 sie blockweise Daten zwischen den Speichem kopieren. Der Adressraum der zu 
lesenden Daten und der Zieladressraum wird entsprechend gesetzt und der 
Kopiervorgang wird gestartet. Das Setzen kann durch die IPAE erfolgen. 
In einer hardwaremasig aufwendigeren Lttsung kann die Funktion diirch eine 
in^lementierte MemoryManagementUnit (MMD) realisiert sein. Die Funktionsweise 
15 ist durch den Stand der Technik definiert und bekannt. Zusainmengefafit 
curbeitet eine MMU wie folgt: 

Der von der MMU verwaltete RRAM Speicher ist in mehrere Seiten (Pages) 
aufgeteilt. Jede Page enthSLlt Daten eines virtuellen Speicherraumes innerhalb 
eines extemen Speichers. Beispielsweise kOnnen die hexadezimalen RRAM- 

20 Adressen OxOaOO. .OxOaf f Daten des extemen Speichers an den Adressen 

0xbdl3200. .03d>dl32ff enthalten. Zur Verwaltung der Adressumsetzung wird eine 
Adresstlbersetzungseinheit verwendet, die gewOhnlicherweise durch Lookup- 
Tabellen realisiert ist. Aufgabe einer MMU ist es insbesondere einen grofien 
Speicherraum auf einen sehr viel Kleineren (in diesem Fall der RRAM) zu 

25 libersetzen. Dies geschieht derart, dass Seiten je nach Bedarf von dem groSen 
Speicherraum in den Kleinen kopiert werden. Sobald eine Seite nicht mehr 
benOtigt wird kann diese gelOscht und/oder tlberschrieben werden. Wenn die 
Daten auf der Seite ver&tidert wurden, wird die Seite bevorzugt vor dem 
IiOschen/tteerschreiben in den grofien Speicherraum zurUckgeschrieben. 

30 Die Adressumsetzungeeinheit arbeitet derart, dass ein httherwertiger Teil der 
physikalischen Adresse (also die Adresse der Seite) in dem Lookup-Speicher 
abgelegt wird und auf die entsprechenden Daten der Seite im RRAM zeigt, 
sobald die Seite innerhalb des kleinen Speichers (RRAM) verfttgbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 

35 auch keine Referenz eingetragen. In diesem Fall muss die Seite erst von dem 
grofien (extemen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gemSlB dem vorstehenden Ablauf 
Cberschrieben werden. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
40 durch den Sequenzer erfolgen, indem von der MMD ein DMA-Kontr oiler 

angesteuert wird. Diesem werden die entsprechenden Seitenadressen im RRAM und 
extemen RAM, sowle die SeitengrOfie durch die MMCr zur VerfOgung gestellt (z. 
B. in Register eingetragen) . 

45 Die ROP-PAE besitzt einen Anschlufi an eine Konf igurationselnheit die die ROP- 
PAE entsprechend des tiblichen verfahrens konfiguriert md rekonfiguriert. In 
einer bevorzugten Ausftlhrung kann die CT auf den IRAM lesend und/oder 
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schreibend zugreifen, um Daten und/oder Code fttr den Sequenzer im IRAM zu 
verwalten. 

In einer besonders bevorzugten Ausgestaltung kann die ROP-PAE selbstSndig 
5 Code fUr den Sequenzer tiber das PA Bussystem und/oder den EXTBUS aus dem 
extemen RAM laden. 

In einer bevorzugten Ausftlhrung ist der IRAM in itiehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente k6nnen 
10 beispielsweise ftir einige der folgenden Funktionen aufgeteilt sein: 

Sequenzerspeicher, Stack (z.B. ft\r Regis t ersatz ) , Datenspeicher , Heap, 10- 
Puffer, Puffer zu extemem RAM bzw. Cache, Lookuptabellen, Konfigurationen 
ftir PAEs und/oder Busse, der Registersatz der ROP-PAE. 

Je nach Fimktion kOnnen dazu folgende Ansteuerxnechanismen vorgesehen sein: 
15 Sequenzer- /Code-Speicher: Programmzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste Speicherstelle des Stack (Rsp) , 
gegebenenfalls auch ein FramePointer (Rfp) , wie er nach dem Stand der Technik 
(z.B, Intel Pentium) bekannt ist. 
20 Konfigurationen fttr PAEs und/oder Busse: Hierrauf kann ein Zeiger innerhalb 
der CT und/oder - inqplementierungsabhSngig ein Zeiger innerhalb der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt durch die PAE mit bevorzugt 

25 hardware technisch fest vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen werden 
typischerweise durch den Conqpiler oder Progranraiierer aufgebaut. Die 
Adressierung dieser Bereich erfolgt durch das auszuftihrende Programm und/oder 
Betriebssyetems und wird innerhalb der Programmes und/oder Betriebssystems, 

30 ggf . unter Zuhilfenahme der Regis t ersatzes und der ALU des Sequenzers, 
berechnet . 

In einer mOglichen Variante ist der IRAM koraplett oder teilweise, wie bei den 
IPAEs beschrieben, durch RAM- PAEs aufierhalb der ROP-PAE realisiert. FOr ggf. 
unterschiedliche Segmente kOnnen unterschiedliche RAM- PAEs verwendet werden. 

35 

In einer bevorzugten Ausgestaltung kOnnen einige oder alle Segmente als 
aktive Speicher ausgestaltet sein, also eine DMA und/oder MMCJ besitzen und 
eomit selbstandig Daten in oder aus den ihrem Speicher von oder nach anderen 
Speichem oder Peripheriegeraten kopieren. Insbesondere kttnnen sie die 
40 Funktionen der Speicher aus der DE 199 26 538.0 aufweisen, z. B. FIFO, 
Stack, Random Access, Cache, etc., wobei ftir jedes Segment einzeln die 
Funktion konf igurierbar und/oder dtxrch den Sequenzer programmierbar ist. 

In einer Ausftlhrung kann der IRAM als Multi-Port Speicher ausgeftthrt sein. 
45 Dieser kann den ggf. auch gleichzeitigen Schreib- und/oder Lese-Zugriff durch 
mehrere Speicher zugr if fseinhei ten auf den Speicher inhalt ermttglichen. 
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Speicherzugrif fseinheiten kOnnen beispielsweise externe imd/oder interne 
Peripherie/ Prozessoren, andere PAEs sein. 

In einer besonderen Ausftlhrung kann die ROP-PAE als lokale und ggf . auch 
5 globale Konfigurationseinheit ahnlich einer CT fOr ROP-PAEs in der Utagebxmg 
arbeiten oder unter anderem diese Funktion mit erf alien. Bevorzugt eurbeitet 
die ROP-PAE nach dem aus der DE 196 54 846.2->53 bekannten Verfahren bel der 
Verwendung als lokal Konfigurationseinheit. Wird die ROP-PAE als globale 
Konfigurationseinheit verwendet, oder hat sie sehr viele lokale PAEs zu 
10 konfigurieren, wird bevorzugt das Verfahren nach der DE 196 54 593.5-53 

verwendet, das eine FILMO-Funktionalitat aufweist und daher sehr viele auch 
unabhangige Konf igurattonen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch den Sequenzer /Microcontroller Konfigturationen im IRAM und konfiguriert 
diese an PAEs und/oder sich selbst md/oder bestimmt den Ablauf des 
15 Sequenzers /Microcontrollers. Bevorzugt findet hierbei eine synchronisation 
mit einer (Ibergeordneten Konfigurationseinheit (z. B. CT oder andere PAEs) 
ahnlich der bekannten Inter -CT-Protokolle (DE 198 07 872.2, DE 100 28 397.7 , 
DE 199 26 538.0 ) statt. Die ROP-PAE kann Konfigtirationen tiber eines der 
EXTRAM- Interfaces selbst laden und/oder Konfiguratlonen von einer 
20 (Ibergeordneten Konfigurationseinheit Ober das CT Interface anfordem. Die 
Punktionsweise kann ahnlich der Rekonfigurationseinheit in der DE 196 54 
846.2-53 sein. 

Zusammengefafit ist der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
Microcontrollersystemes, dessen Busanbindung und/oder dessen Datentransfers 
und/oder dessen Prograiranablauf einem VPa-System entspricht. Mit anderen 
Worten handelt es sich urn eine Miiltiprozessoranordniingr deren Bussystem auf 
dem Prinzip der VPU-Architektur beruht. Die einzelnen Prozessoren werden von 
bevorzugt von einer Ubergeordneten Steuereinheit (CT) verwalfcet. Die 
Datentlbertragung ist selbstsynchronisierend tiber die RDY/ACK Protokolle der 
Bussysteme. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Prozessorstatus angesehen, der tiber das Triggerbussystem reprSsentiert wird 
und den Status einer Menge von Prozessoren reprasentiert , der unter den 
Prozessoren zur Ablauf steuerwig ausgetauscht werden mufi. Hierzu wird 
verwiesen auf DE 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

Ebenfalls wird Schutz beansprucht ftir ROP-PAEs, die zusatzlich zu ihrem 
Anschluss an die intemen Bussysteme des Arrays aus PAEs einen dedizierten 
Anschluss (lO-Channel) an ein Qherregionales Bussystem aufweisen, das 
insbesondere Daten tiber lange Strecken innerhalb des Arrays tlbertragt 
und/oder insbesondere einen direkten AnschluS an die Peripherie aufweist. Der 
Anschlufi an die Peripherie kann dabei direkt erfolgen, indem z. B. das 
Bussystem bereits dem peripheren Protokoll entspricht oder tiber entsprechende 
Protokollwandler zxir Utasetzung des Protokolls erfolgen. Das dedizierte 
Bussystem kann dabei bereits einem Industriestandard entsprechen, z. B. PCI, 
RapidIO, Firewire, USB, Ethernet, RAMBUS, DDR-RAM, etc. um somit einen 
einfachen und unaufwendigen Anschluss der peripheren Gerate zu ermOglichen. 

25 
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Gegebenenfalls kdnnen auch in zwischengeschalteten lOAGs (vgl. DE 196 54 
595.1-53 ) Protokollkonvertierungen derart dxarchgeftihrt werden, dass ein 
internes vereinfachtes und ggf . propriet&res Busprotokoll auf ein oder 
mehrere konqplexere externa Standardprotokolle ttbersetzt werden. 
5 Es soil besonders darauf hingewiesen werden, dass unter Peripherie auch 

Speicher verstanden werden, wie bei den bereits aufgezSUilten Busprotokollen 
verdeutlicht wird. 

Ebenfalls ist erf indungsgemSLfi besonders relevant, dass PAEs auch mehrere 
AnschlUsse an dedizierte Bussysteme aufweisen kOnnen. 
10 Desweiteren Bind anwendungsabhangig auch Archltekturen sinnvoll, bei denen 
nur eine Teilmenge der PAEs AnschlUsse an ein dediziertes Bussystem aufweist, 
Oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von AnschlUssen 
an ggf . auch unterschiedliche dedizierte Bussysteme aufweisen. 

15 Die beschriebene Struktur kann durch erweiterte und verbesserte 

Halbleiterherstellungsverfahren und -strukturen besonders leistungsfShig 
implement iert werden, indem der Speicher auf dem physikalischen Chip raumlich 
tiber Oder unter den logischen Funktionen (ALU, Steuerung, Busse, etc.) der 
PAS angeordnet wird. HierfUr wird Schutz beansprucht. 

20 Dazu wird Ober der nach dem Stand der Technik bekannten ersten 
Halbleiterstruktxir (z. B. Silizium) vuid der damit aufgebauten 
Transistorstrukturen eine oder mehrere weitere Ebenen von 

Halbleiter struktur en (Transistorstrukturen) aufgebracht, die ftlr zusatzliche 
Funktionen genutzt werden k6nnen. Beispielsweise kfinnen in einer ersten Ebene 
25 die Logik und Gatter der PAE-Funktion und in einer weiteren zusatzlichen 
Ebene die Speicherfunktionen iniplementiert werden. 

In einer bevorzugten Baweise werden die einzelnen Halbleiter schichten durch 
eine Isolierschicht voneinander getrennt. Die Isolierschicht kann 
Durchkontaktierungen (Vias) aufweisen, urn Slgnale zwischen den einzelnen 
30 Halbleiter schichten zu Obertragen, 

Die Verdrahtungsstrukttju: kaxm je nach Anwendiang unterschiedlich implement lert 
sein. Beispielsweise k6nnen direkt tiber jeder Halbleiterschicht 
Verdrahtungsebenen und/ oder eine globale Verdrahtungsebene, die alien 
Halbleiterschichten zugeordnet ist vorgesehen sein. 

35 

urn eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Qesamtschaltung, also alle Halbleiterstrukturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beachten, dass der 
Stromverbrauch, also die Verlustlei stung, aller Halbleiterstrukturebenen 
40 zusammen innerhalb eines akzeptablen Bereiches bleibt, der zu keiner 
(Jberhitzung und dem damit verbundenen Ausfall der Schaltung ftihrt. 
Es kann durch eine geeignete Zusammenstellung der Funk tionseinhei ten der 
einzelnen Halbleiterebenen den entsprechenden Anforderungen entsprochen 
werden . 

45 Beispielsweise ist ftir die vorgeschlagene Architektur eine Ebene von 
liogikhalbleiterstrukturen und eine weitere Ebene von 

Speicherhalbleiterstrukturen vorzusehen, die fOr diese Anforderungen geeignet 
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sind. wahrend die irregularen \md wenig redundanten Logikhalbleiterstrukturen 
eine vergleichsweise hohe Pehlerquote mit hoher Verlustleistxing aufweisen, 
kttnnen Speicherhalbleiterstrukturen vergleichsweise redundant mit niederer 
Pehlerquote und durch geeignete Speicherverfahren (z. B. DRAM) auch mit 
5 geringer Verlustleistung implementiert werden. Es wird explizit darauf 

hingewiesen, dafi es mdglich ist, Pelder vorzusehen, bei welchen nicht alle 
Speicherpiatze und/oder alle Logikhalbleiterstrukturen voll ftmktional sind; 
es ist lediglich erf orderlich, Mindestanf orderungen sicherzustellen und/oder 
eine ordn\mgsgezn£lfie Verwaltung. Redxindanzen sind bevorzugt far beide 
10 Strukturen separat zu betrachten. 

Die Aufbringung der mehrfach tibereinander liegenden Halbleister strukturen 
kann nach unterschiedlichen Verfahren er£olgen. Neben dem bereits 
beschriebenen Verfahren des Aufbringens einer weiteren Halbleiterebene Ober 

15 einer Isolierschicht, was z. B. durch Aufdainpfen imd/oder Aufkristallisieren 
erfolgen kann, sind auch thennische Oder mechanische Verbindungen mOglich, 
indem z. B. die auf ziibringende Siliziuiastruktur aufgeldtet- oder aufge)0.ebt 
wird. Zum Aufldten eigenen sich beispielsweise auch Verfahren, die aus den 
Technologien zum Verbinden von Halbleiterchips mit Gehflusen bekannt sind. 

20 Dabei handelt es sich beispielsweise urn Reflow-Ltttung oder Thentiokoitgpression. 
Prinzipiell sind auch die einfache mechanische Verbindungsmethoden mdglich, 
wobei sodann die Verdrahtung beispielsweise per Wirebond erfolgen kann. 
Voraussetzung hierfUr ist, dass die Siliziumstrukturen unterschiedliche 
Grdfien aufweisen, sodass die Drahte von einer Siliziumstrukturoberfiache zur 

25 nMchsten gedrahtet werden kdnnen und, dass die Anzahl der Verbindungen 
vergleichsweise gering ist, damit diese mittels Wirebond noch realisiert 
werden kOnnen. 

Zur Optimierung der Ausbeute "kann insbesondere das Redundanzverfahren nach DE 

30 197 57 200.6-33 angewendet werden. Es soli erwShnt sein, dass das Verfahren 
nach DB 197 57 200.6-33 fOr alle PAEs vorgesehen werden kann, also z. B. ftlr 
AliU-PAEs genauso wie fUr RAM-PAEs. Mit anderen Worten kOnnen ftlr sflmtliche 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverfahren angewendet 
werden. Auch die dortigen Textverfahren sind implementierbar . 

35 FUr PAEs mit hauptsSchtlich f eingranularen Strukturen, also z. B. Speicher 

(RAM-PAEs) Oder FPGAs ist es von Vorteil, diese f eingranularen Struktvuren mit 
einer entsprechend f eingranularen Redundanz zu versehen, d. h. nicht oder 
nicht nxir die RAM-PAE Oder eine eine FPOA-Struktur aufweisende PAE mit einer 
redundanten PAE zu versehen, sondem die feingranulare Struktur selbst mit 

40 Redundanz zu versehen. Das heisst, dass beispielseise den Speicherzellen 
(bzw, PPQA-Zellen) redundante Speicherzellen (bzw. FPGA-Zellen) zugeordnet 
werden. Die Verbindungen (Leitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erfordemisse einer redundanten Struktur 
angepafit. Der Aufbau redmdanter Strukturen ftlr feingranulare Zellen, wie z. 

45 B. Speicher oder FPGAs ist durch den Stand der Technik bereits bekannt. FOr 
das Verstandnis von Ausgestaltungsdetails wird auf diesen verwiesen. 
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Die Verlustleistung la&t sich nach den Verfahren von DE 196 51 075.9-53 und 
DE 101 35 210.7-53 erheblich minimieren, wodurch sehr hohe 
Integrationsdichten ermfiglicht werden. 

S Es soil darauf hlngewiesen werden, dass die Anzahl der tibereinanderliegenden 
Halbleitersturkturen keineswegs auf zwei begrenzt ist. Hit f or tschrei tender 
technlscher Bntwlckliuig und Optlmierung 1st eine stelgende, auch sehr grofie 
Zahl von {ibereinanderliegenden Ebenen realisierbar. 

10 Die Ebenenaufteilung mufi dabei, weder bei einer zwellagigen, noch bei einer 
mehrlagigen Struktur auf eine ALU-Speicher-auf teilung limitiert sein. Bereits 
bei zweilagigen Strukturen fcann es sinnvoll sein den Speicher zusammen mit 
den ALUs in eine Lage zu legen und die andere Lage komplett fOr die 
Bussysteme oder die Bussysteme und lO-Ansteuerungen (lOAGs) zu verwenden. Die 

15 Bussysteme kOnnen dabei tlber die einf ache Verdrahtung hinaus bevorzugt auch 
die Schaltelemente (Multiplexer, Transmission-Gates, etc.) und/oder 
VersWbrkerelemente (Treiber, etc.) und/oder Synchronisationselemente 
(RDY/ACK-Steuerung) , die jeweils Halbleiterstrukturen zu deren Realisierung 
benCtigen enthalten. 

20 Desweiteren kann es sinnvoll sein, eine Ebene far die Konf igurationsspeicher 
und/oder Korifigurationsregister und/oder CT und deren Speicher vorzusehen. 

Figur 6 zeigt eine Implementierung einer ROP-PAE. Architektonisch wurde die 
RAM-PAE innerhalb der ALU-PAE inplementiert . Der gesamte Registersatz 

25 <RO..Rn, Rpp, Rap, Rfp, Rap) ist in der ROP-PAE. untergebracht. Zugrif £e auf 
die Register durch die ALU eind schnell und mit gerlngem Aufwand mttglich. 
Adressen und Daten kdnnen direkt von der ALU an den Speicher tibertragen 
werden, ohne ein Bussystem aufierhalb der ROP-PAE wie z. B. 0105 zu benOtigen. 
Bevorzugt welst eine ROP-PAE einen oder mehrere dedizierte lO-Channel zur 

30 DatenUbertragung mit der Peripherie auf (beispielsweise 0601, 0602) . 

Datenverbindungen zu den restlichen PAEs kflnnen wie bereits bekannt durch 
FRE6 und/oder BREQ realisiert werden. Hier angedeutet durch den Leseport 0603 
und Schreibport 0604. 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
35 damit bereits eine interne RUckkopplung des AL0-Ausgangs auf die Register 
auf. Optional kann dies auch durch die Verwendung eines ROP-PAE extemen 
Busses (z.B. 0105) und einer RUckkopplung durch ein BRBG, wie bereits bekannt 
erfolgen (0605). 

40 Fig\ir 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 

Figur 7a zeigt einen einfachen Aufbau mittels Wirebond Verbindungen zur 
DatenUbertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei Chips, 
aufeinander montiert sind. Ein Chip besteht stark vereinfacht aus einer 
Halbleiterebene zur Realisierung von Transistoren (z. B. Silizim, 0704), 

45 mehreren Metalllagen zur Realisierung von Verbindungsleitungen (z. B. 

Aluminium und/oder Kupfer; dargestellt sind 3 Lagen 0705a, b,c), die jeweils 
durch eine Isolierschicht untereinander und gegenttber 0704 elektrisch 
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getrennt sind, und eine obere, besonders widerstandsfahigen Isolierschiclit 
0706. In die Isolierschichten sind Durchgangsleitungen aus Metall zur 
elektrischen Verbindung der einzelnen Ebenen, sogenannte Vias, eingefagt. 

5 In Figur 7b sind die beiden Dices mittels einer Art Flip -Chip- Technologie 
miteinander verbunden, wobei die Obertragung von Signalen durcb eogenannte 
Bumps nach dem Stand der Technik erfolgt. Zusatzlich zu den durch die Flip- 
Chip-Technologie gegebenen MJSglicbkeiten des Anschlufi von Bumps (0711) auf 
der jeweils obersten Metalllage soil hier die besondere erfindungsgemafie 

10 Ausgestaltung gezeigt werden, die Bumps unterhalb der Halbleiterschicht (z.B. 
Silizium) zu kontaktieren. Dazu werden elektrische Verbindungen (z.B. 
Aluminium oder Kupf er) , also Vias (0712), durch die Siliziumschicht nach 
unten geftthrt. Die Durchftihrung erfolgt bevorzugt durch Atzen von 
entsprechenden LOchem in die Halbleiterebene. Zwischen den Verbindungen und 

15 der Halbleiterschicht wird eine Isolierung eingefUgt. 

Die DurchfOhrung kann wie bei Pigur 7d angedeutet entweder direkt durch die 
Halbleiterschicht erfolgen oder es werden, wie bevorzugt, zunftchst Wannen 
(0731) in die Halbleiterschicht geatzt, die mit einer Isolierung gefailt 
werden und in welche dann die Vias eingebracht werden. 

20 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten isolierschicht (0721) einer ersten 
Halbleiterstruktur, die in diesem Fall dttnner ausf alien kann, wird eine 
weitere Balbleiterebene (0722) aufgebracht. Dazu wird die Isolierschicht 

25 (0722) zunftchst durch Atzen und/oder Schleifen mOglichst eben genaacht. Das 
Aufbrlngen der Halbleiterschicht kann d\u:ch Aufdanpfen, Aufziehen von 
Kristallen oder bevorzugt durch Aufkl eben oder klebeahnlichen Verbindungen 
aufgebracht. Wesentlich, v. a. bei der Verwendung von Verklebungen ist, dass 
durch die aufgebrachte Halbleiterstruktur und das Verbindungsmaterial (z.B. 

30 Klebematerial) durchgeStzt werden kann. Die Durchatzung ist erforderlich, urn 
Kontakte, wie in Fig. 7b beschrieben zu den Vias in der daimnterliegenden 
Isolierschicht zu fChren. 

Die Durchftihrung der Kontakte erfolgt gemas Figur 7d z. B. durch das Einatzen 
schinaler Kanaie, in die ein Isoliezmaterial eingebracht wird. Danach wird in 
35 einem weiteren Schritt in das Isoliermatierial ein schinaleres Via eingefttgt, 
indem z. B. zuvor in dem Isoliermaterial ein Loch entsprechenden Durchmessers 
z. B. durch Atzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen grttsserer Wannen (0731) vor, welche 
mit Isolieimaterial geftlllt werden. In die Wannen werden dann ggf . mehrere 
40 Vias (0712) wie beschrieben eingeftigt. 

Die Piguren 7e,f,g,h zeigen verschiedene bevorzugte funktionale Aufteilungen 
solcher Halbleiterstapel. Die Halbleiterebene ist jeweils schraffiert 
dargestellt und die Isolierschicht durch dicke Umrandung. Dazwischen liegen 
45 die Metalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht auf 2 
Stapel beschrankt, ebenso sind grfifiere Stapel, z.B. mit 3,4, oder mehr Ebenen 
maglich. 
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Die mehrfache beschriebene Auftreimung zwischen Speicher und ALUs ist in Fig. 
7e dargestellt. 

Fig. 7f zeigt die Trennung der Bussysteme mit den notwendigen Schalteinheiten 
5 Tind der lO-Struktur von den ALUs und Speichem, die sich in diesem Beispiel 
in derselben Ebene befinden. 

In Fig. 7g liegen auf der untersten Ebene die ALUs. Auf oberster Ebene liegen 
die Speicher und ggf . die Treiber der 10. Somit sind die stxukturen mit hoher 
Verlustleistmg an den aufieren RSlndem der Stapel untergebracht . Besonders 
10 hierfUr wird Schutz beansprucht, da dadurch eine besonders optimale 

Wtaneabfuhr mOglich ist. Die Bussj/Bteme und deren Schalteinheiten sind in der 
mit tier en Ebene untergebracht. 

In dein Beispiel Fig. 7h sind in den mittleren Ebenen verlustlelstungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieaufwendigen 
IS 10 sind zxir optiinalen warmeabfuhr in den lUUidem untergebracht. 

lOx-PAEs 

Aus DE 199 26 538.0 sind Speicher (lORAM-PAEs) mit einem dedizierten 

Anschluss an exteme Einheiten wie z.B. Peripherie und/oder Speicher bekannt. 
20 Weiterhin sind aus DE 196 54 595.1-53 und DE 102 06 653.1 dedizierte 

Einheiten (z. B. Interface- Baugruppen (IBG)) zum Anschluss von extemen 

Einheiten wie z. B. Peripherie und/oder Speicher bekannt. 

Beide Verfahren weisen das Problem auf, dass ein zusatzlicher Aufwand zur 

Datenkoimnunikation zwiechen PAEs, insbesondere datenverarbei tender und/oder 
25 datenberechnender PAEs und extemen Einheiten betrieben werden xmiss, indem 

die Daten explizit zwischen den PAEs und den IBGs und/oder lORAM-PAEs 

tibertragen werden mUssen. 

Es wird nunmehr erfindungsgemaS vorgeschlagen und wie berelts vorstehend 

30 mehrfach erwahnt ftir beliebige PAEs, insbesondere jedoch fOr 

datenverarbeitende und/oder datenberechnende PAEs (z. B. ALU-PAEs nach DE 196 
51 075.9-53 , IPAEs, ROP-PAEs) und datenspeichernde PAEs (RAM-PAEs nach DE 
100 50 442.6 ) einen oder mehrere dedizierten AnschlUsse (lO-Channel) an 
exteme Einheiten wie z. B. Peripherie und/oder Speicher vorzusehen. Dadurch 

35 ist eine direkte KommunikationsmOglichkeit der PAEs, die nachfolgend lOx-PAEs 
genannt werden, und extemen Einheiten gegeben. Der Vorteil dieser 
Architektur liegt darin, dass die Verbindxang des Arrays aus PAEs (PA) mit der 
Peripherie (extemem Speicher und/oder lO-Einheiten) erheblich effizienter 
aufgebaut werden kann. Die bestehenden konfigurierbaren Bussysteme der PAEs 

40 untereinander (BUS) mttssen nicht mit den lO-Datentransfers belastet werden. 
Desweiteren kann bei einer entsprechenden Ausgestaltung des lO-Channel die 
Adressierung der Daten fUr oder elnzelne PAEs sehr vlel einfacher 
durchgefUhrt werden, als dies mittels des BUS mOgXich ware. 
Dies kann bevorzugt dadurch realisiert sein, dass jede an einen lO-Chaxmel 

45 angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einfach angesprochen werden, indem die 
Adresse Uber den lO-Channel Obertragen wird und jede Eixihelt diese Adresse 
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mit Ihrer eigenen vergleicht. Wenn die Adressen tibereinstimmen, ist die 
Einheit adressiert und die Daten Bind fUr diese Einheit bestinimt. 
Bevorzugt kaim jede Einheit nicht nur die Zieladresse, also die Adresse der 
Einheit fUr die die Daten bestinrnt sind, sondem auch ihre eigene Adresse 
5 Obertragen, um eine Identif ikation des Senders zu ermOglichen. 

Besonders ef fizient kann das Vorsehen von lO-Channels fOr nur eine Teilmenge 
aller PAEs sein. Beispielsweise bietet es sich an, nur Streifen von paes ndt 
lO-Channel-Erweitenmg iimerhalb einer Anordnung von PAEs (PAE-Array, PA) 
10 vorzusehen. Dadurch wird eine verbesserte Fiachen* und Kosteneffizienz 
gegenUber der Iniplementierung der lO-Channel-Erweiterung in alle PAEs 
erreicht . 

PAESf die besonders hohe Koxnntunikationsanf ordenmgen aufweisen, k5nnen 
15 applikationsabhfingig auch an mehrere lO-Channel angeschlossen sein. 

pie dedizieren lO-Channels k6nnen dabei auf unterschiedlichen Bussystemen 
aufgebaut sein, z. B. insbesondere nach DE 197 04 742.4 Oder als paralleles 
Standardbussystem wie Rapid-IO, PCI, AMBA Oder serielles Standardbussystem 
20 wie OSB, Firewire, Ethernet. 

Besonders leistungsfahig kann die Implementierung von lO-Channels in PAEs 
dann sein^ wenn diese nicht direkt an die extemen Einheiten gefUhrt sind, 
sondem zunAchst an eine lO-VerwaXtungseinheit (lOAQ) , die ahnlich dem 

25 Protokollkonverter nach DE 102 06 653.1 oder der lOAO nach DE 196 54 595.1- 
53 aufgebaut sein kann. Der Vorzug liegt darin, dass ein einfaches internes 
Busprotokoll zur Steuerung der lO-Channels verwendet werden kann. Ebenso wird 
nur eine geringe "Intelligenz" in jeder einen lO-Channel aufweisenden PAE 
benOtigt, wodurch die PAEs jeweils flAchenmagig klein und unaufwendig zu 

30 programmieren sind. 

Die eigentliche Verwalt\mg und Ansteuerung der extemen Einheiten wird in den 
lOAGs durchgefdhrt, die diirchaus gr<ffier und aufwendiger ausgestaltet sein 
kiJnnen . 

35 Die lOAGs kttnnen zur Erfttllung ihrer Aufgabe selbst eigene Sequenzer und/oder 
Mikrokontroller und ggf . auch eigenen Speicher aufweisen. Insbesondere Icann 
die XOAO auch Speicherxnanageroenteinheiten und AdressObersetztingseinheiten 
aufweisen. Je nach Applikation kGimen Interruptkontroller wie z. B. nach dem 
Stand der Technik bekannte (i8259) in der lOAG in5>leinentiert sein, die 

40 Interrupts ggf. auf Triggersignale nach DE 197 04 728.9 Ubersetzen. 



SIMD PAEs 

Bei der Verwendung von rekonfigurierbaren Technologien zur Verarbeitung von 
45 Algorithmen entsteht ein wesentliches Paradoxon: (1) es sind, um eine 

raOglichst hohe Rechenleistung zu erhalten, komplexe ALtJs erforderlicb, wobei 
der Aufwand fUr die Rekonf iguration minimal sein sollte; (2) es sollten die 

31 
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ALUs m<)glichst ein£ach xind felngranular sein, tun elne effiziente 
Datenverarbeitung au£ Bltebene zu em^llchen; (3) es sollte die 
Rekonflguratlon un6 Datenverwalttmg derart intelligent und schnell erfolgen, 
dafi sie effizient und einfach zu programmieren ist. 

5 

Bisherige Technologlen vervrenden entweder a) sehr kleine ALUs mit wenig 
Rekonf igurationaunterstutzung (FPQAs) und sind au£ Bitebene effizient oder b) 
grofie ALUs (Cameleon) mit wenig RekonfigurationsunterstUtzung, oder c) eine 
Mischung aus gro&en ALUs und kleinen ALUs mit Rekonfigurationsunterstatzung 
10 und Datenverwaltung (VPUs) . 

Da die VPU-Technologie die leistungsffihigste Technik darstellt, soli auf ihr 
aufbauend ein optimiertes Verfahren geschaffen werden. Bs soil ausdrttcklich 
darauf hingewiesen werden, dafi dieses Verfahren ebenfalls £ttr die anderen 
Architekturen eingesetzt werden kann. 

15 

Der Fldchenaufwand zur ef fizienten Steuerung von Rekonfigurationen ist nit 
einer Menge von ca. 10.000 bis 40.000 Oattem pro PAE vergleichsweise hoch. 
Unterhalb dieser Gattermenge lassen sich in der Regel nur einfache 
Ablaufsteuerungen reals ieren, die die Prograwmierbarkeit von VPUs erheblich 
20 einschranken und eine Verwendxmg als General Purpose Prozessor erschweren. 
Sofem auf eine besonders schnelle Rekonfiguration abgezielt wird, mQssen 
zusatzliche Speicher vorgesehen werden, wodurch die erforderliche Gattermenge 
nochmals erheblich ansteigt. 

25 Utn ein ordentliches Verhaitnis zwischen Rekonf igurationsaufwand und 

Rechenleistung zu erhalten, ist somit der Einsatz von groSen ALUs (viel 
Funktionalitat und/oder grofie Bitbreite) zwingend erforderlich. Werden die 
ALUs jedoch zu grofi, sinkt die nutzbare parallele Rechenleistung pro Chip. 
Bei zu kleinen ALUs (z. B. 4 -bit) ist der Aufwand zur Konfiguration 

30 aufwendiger Punktionen (z.B. 32 -bit Multiplikation) zu hoch. Insbesondere der 
Verdrahtungsaufwand wSchst in kommerziell nicht mehr sinnvolle Bereiche. 



s;emd RecheRwerHe 

35 X3m ein ideales Verhaitnis zwischen der Verarbeitung von kleinen Bitbreiten, 
Verdrahtungsaufwand und der Konfiguration aufwendiger Punktionen zu erhalten, 
wird nun der Einsatz von SIMD-Rechenwerken iimerhalb von ALU-PAEs (also 
insbesondere der in dieser Erfindung offenbarten PABs, ebenso wie in PAEs 
nach DE 196 51 075.9-53 und DE 199 26 538.0 ) vorgeschlagen. Dabei werden 

40 Rechenwerke der Breite m derart zerteilt, dafi n einzelne BlGcke der Breite b 
=3 m/n entstehen. Durch Kon£iguration wird je Rechenwerk vorgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soil, oder ob das Rechenwerk in elnen oder 
mehrere BlGcke, jeweils gleicher Oder unterschiedlicher Breite zerlegt sein 
soil. Mit anderen Worten kann ein Rechenwerk auch derart zerlegt sein, 6a& 

45 innerhalb eines Rechenwerkes unterschiedliche Wortbreiten zugleich 

konfiguriert sind (z.B. Breite 32-bit, zerlegt in 1x16-, 1x8- und 2x4 -bit) . 
Die Daten werden derart zwischen den PAEs tibertragen, dafi die zerlegten 
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Datenworte (SIMD-WORD) zu Datenworten der Bitbrelte m zusanamengefeifit werden 
und als Paket tiber das Netzwerk tlbertragen werden. 

Das Netzwerk Obertr^lgt ixnmer ein kon^lettes Paket, d.h. alle Datenworte 
innerhalb elnes Paketes, und werden nach dem bekannte Handshake-Verfahren 
5 tibertragen. Elnzelne Datenworte Innerhalb des Paketes kOnnen dabei auch 

unbenutzt seln, d.h. keine Information enthalten. Dies kann durch zusfttzliche 
Statusleitimgen und/oder Handshakes ignal en wie z. B. dem RDY/ACK Protokoll 
realisiert sein. 

10 

SIMP BusBvsteme 

FUr einen e££izienten Binsatz der von SII4D-Rechenwerken ist eine flexible und 
effiziente Umsortierung der SIMD-WORD unterelnander innerhalb eines Busses 
Oder zwischen unterschiedllchen Bussen erforderlich. 

15 Die Busschalter nach Figur llkttnnen derart modifiziert werden, dafi eine 
flexible Vernetzung der einzelnen SIMD-WORD mdglich ist, Dazu werden die 
Busse aber beispielsweise Multiplexer, Busschalter, Transmissiongates, Pass- 
Transistoren (nachfolgend unter dem Begrif f Multiplexer zusammengefaSt) 
entsprechend den Rechenwerken teilbar ausgelegt, derart dafi durch 

20 Konfiguration die Teilung bestixnmt werden kann. Hit anderen Worten wird 

beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, sondem 
n einzelne Multiplexer der Breite b m/n. Es ist nunmehr lodglich, die 
Datenbusse fOr b bit Breite zu konfigurieren. Durch die Matrixs truktur der 
Busse (Figur 11) ist die Utaisortierung der Daten ebenfalls mfiglich, wie in 

25 Figur 12a dargestellt. 

Die Handshakes der Busse werden logisch derart verkntipft, da£ ein gexaeinsamer 
Handshake fUr den neu geordneten Bus aus den Handshakes der ursprCnglichen 
Busse generiert wird. Beispielsweise kann ein RDY ftlr einen neu sortierten 

30 Bus aus einer logischen UND-Verknttpfung aller RDYs der Daten fUr diesen Bus 
liefernden Busse generiert werden. ES^enso kann beispielsweise das ACK eines 
Daten liefernden Busses aus einer DND-Verknapfung der ACKs aller Busse 
generiert werden, die die Daten weiterverarbeiten. Prinzipiell sind bei der 
Ixnplementierung geeignete VerknUpfungen dergestalt zu wShlen, dass diese den 

35 jeweils verwendeten Busprotokollen entsprechen. 

In einer ersten AusfUhrungsvariante f inden die Verkntipfungen der Handshakes 
innerhalb eines jeden Busknotens statt. Dadurch wird es m5glich, einem 
Bussystem der Breite m, bestehend aus n Teilbussen der Breite b, bevorzugt 
40 nur ein Hand- shake- Protokoll zuzuordnen. 

In einer welteren besonders bevorzugten Ausgestaltung werden stotliche 
Bussysteme in der Breite b ausgestaltet, die die kleinste realisierbare Ein- 
/Ausgabe Datenbreite b eines SIMD-Word entspricht. Entsprechend der Breite 
45 der PAE Datenpfade (m) besteht nunmehr ein Eln-/Ausgangsbus aus m/b = n 
Teilbussen der Breite b. Beispielsweise besitzt eine PAE mit 3 32bit 
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Elngangsbussen und 2 32 bit Ausgangsbusse bei elner kleinsten SBID-Wortbrelte 
von 8 tatsflchllch 3x4 8bit Bingangsbusse und 2x4 Bblt Ausgangsbusse. 
Jeder der Teilbusse weist bevorzugt sflmtliche verwendeten Handshalce- und 
Steuersignale au£, beisplelsweise RDY/ACK und der Reconfig-Trigger nach D£ 
5 197 04 738.9 und eln global es Reset Signal, etc. 

Der Ausgang einer PAE versehdet bevorzugt dies el ben Steuersignalen fCr 
samtliche n Teil-Busse. Bingehende Quittierungssignale aller Teilbusse warden 
bevorzugt ndteinander logisch verknUpft, z. B. durch eine UND-Funktion. Die 
Bussysteme k&nnen jeden Teilbus frei verschalten und unabhMngig routen. Die 
10 Bussysteme und insbesondere die Busknoten verarbeiten und/oder verknUpfen die 
Handshake- Signal e der einzelnen Busse unabhSngig ihres Routings, ihrer 
Anordnung und Sortierung nicht. 

Bei in einer PAE eingehenden Daten werden die Steuersignale s&atlicher n 
Teilbusse derart miteinander verknOp£t, dass ein allgemeingaitiges 

15 Steuersignal quasi als Bussteuersignal fUr den Datenpfad generiert wird, 
Beisplelsweise kOnnen in einer "dependend" Betrlebsart RdyHold-Stufen fUr 
jeden einzelnen Datenpfad eingesetzt werden und erst, wenn s&ntliche RdyHold- 
Stufen anstehende Daten signalisleren, werden dlese von der PAE tibemonimen . 
In elner ' Independend * Betrlebsart werden die Daten jedes Teilbusses einzeln 

20 in Eingangsregister der PAE geschrieben und guittiert, wodurch der Teilbus 
sofort ftlr eine nSchste DatenUbertragung frei ist. Das Vorhandensein aller 
erforderllchen Daten von alien Teilbussen in den Eingangsregistem wird 
innerhalb der PAE durch geeignete logische Verkntipfung der fOr jeden Teilbus 
Im Eingangsregister gespeicherten RDY-Signale detektiert, worau£hin die PAE 

25 rait der Datenverarbeltung beginnt. 

Der wesentliche dcuraus resultierende Vortell dieses Verfahrens ist, dass die 
SIM>-Eigenscha£t von PAEs keinerlei besonderen Einflufi au£ das verwendete 
Bussystem au£wei6t. Bs werden lediglich mehr Busse (n) einer geringeren 
30 Breite (b) ben^tigt. Die Verschaltung selbst bleibt unberahrt. Die PAEs 
verknUp£en und verwalten die Steuerleitungen lokal. Dadurch entfailt der 
zusatzliche Hardwareaufwand in den Bussystemen z\xx: Verwaltung und/oder 
Verknilpfixng der Steuerleitungen. 

35 Figur 11 zeigt einen mOglichen und besonders bevorzugten Aufbau einer 

Busstruktur ftlr VPTT-Architekturen. Die Ausgabeschaltung einer Punktionszelle 
z. B. (PAE , FREO/BREO) (1103, entspricht 0803a,b) ist Uber einen vertikalen 
Bus mit dem horizontalen Bussystem (1102, entspricht 0105) verbunden. 
Entsprechend greifen die Elngabeschaltungen der Funktlonszellen (1101, 

40 entspricht 0801, 0802) iSher einen vertikalen Bus Informationen von dexn 

horizontalen Bussystem ab. In der Figur wird nunnehr verdeutlicht, wie ein 
derartiger Abgriff , bzw eine derartlge Aufschaltung erfolgen kann. 
Wie in Fig. 11a dargestellt erfolgt das Aufschalten eines Ausgabebusses 
(1111) von 1103 au£ 1102 durch ein "Auftrennen" eines Busses des horizontalen 

45 Bussysteins 1102 und das Einftlgen von horizontalen Schaltern (1112), die durch 
Switches, Transmission-Gates, Multiplexer Oder atanlichen geeigneten 
Bauelementen realisiert sein kOnnen. AbhSngig von dem Wert eines Dekoders 
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und/oder Konfigurationsbits (angedeutet durch das Schalter symbol 1113), das 
entspreehend der bekannten Xonfiguratlonsverfabren loevorzugt In einem 
Konflgurationsregister der PAE angeordnet 1st und konflguriert wlrd, 
verblndet der Schalter entweder die beiden Half ten des horizontalen Busses 
5 1102 miteinander oder schaltet den Bus 1111 au£ die eine H£ll£te von 1102 au£, 
die andere HSlfte von 1102 ist dann unterbrochen \ind wird nicht 
weitergeleitet. Die Schaltung wird bevorzugt fUr jeden Bus des horizontalen 
Bus systems verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgriff von Da ten von 1102 

10 und zur Weiterleitung derer an 1101, t)ber vertikale Schalter (1122), die 
durch Switches, Transmission-Gates, Multiplexer oder &hnlichen geeigneten 
Bauelementen realisiert sein kOnnen, werden Da ten bitweise von den Bussen des 
horizontalen Bussystems (1102) abgegriffen imd auf den vertikalen Eingangsbus 
(1121) zur Bingabeschaltung 1101 Qbertragen. Die Ansteuerung der vertikalen 

15 Schalter, d.h. ihre Schaltfunktion, erfolgt durch Dekoder und/oder 
Konfigurationsbits (angedeutet durch die Schaltersymbole 1123), die 
entspreehend der bekannten Konfigurationsverfahren bevorzugt in 
Konfigurationsregistem der PAE angeordnet sind und konflguriert werden. 
Fig. lib und bei entsprechender Modifikation auch Fig. 11a lassen n:l 

20 DatenUbergange zu, d.h. mehrere Busse k&nnen zu einem Bus zusaiomengefaSt 
werden, d.h. die Daten raehrer Busse werden auf einem Bus zusammengefOhrt. 
Fig. 11c zeigt die Busauf trennfunktion der horizontalen VPU-Bussysteme 
(1102) . Jeder horizontale Bus einzeln und je ftlr sich kann an der 
Ausgabeseite der PAE-Kante aufgetrennt werden. Eine Auftrenniing kann durch 

25 Multiplexer oder Schalter erfolgen, wip in Figur 11c angedeutet werden soli. 
Je nach Konfigurationsbit 1132, das bevorzugt fOr jeden Bus des Bussystems je 
einzeln zur Verftlgung steht, wird die Datentibertragung auf das 
danebenliegende Bussystem (1131) freigeschaltet oder unterbunden. 
Typischerweise wird diese Funktion in den Schaltem nach Figur 11a 

30 realisiert, indem die Information des Konfigurationsbits 1132 an die Schalter 
(1112) des danebenliegenden Bussystems (1131) tibertragen wird und 
entspreehend die Schalter zur Weiterleitung ermftchtigt (enabled) oder die 
Schalter eperrt (disabled) . 

35 Figur 12a zeigt ein SIMD-Bussystem entspreehend Figur 11. Dargestellt ist ein 
vereinfachtes horizontales Bussystem 1102, eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschaltimg 1101. Jede Bingabeschaltung weist beispielhaft 2 
Eingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschaltung 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, 

40 1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unabh&igig geroutet werden k6nnen, einige der Teilbusse 
werden nicht verwendet (gepunktete Iiinie) . Die flexible Verschaltung wird 
dadurch erreicht, dass die Schalter nach den Figuren lla-c ftlr jeden Bus 
derart getrennt aufgebaut sind, dass je ein Teilbus von einem Schalter mit 

45 eigener Konf iguration verwaltet' wird. Dadurch ist das Bussystem feingranular 
verschaltbar. 
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Figur 12b zeigt eine SIMD-Datenverarbeitung, bei welcher samtliche Basse 
(1211) dasselbe Handshake (1212) aufwelsen. Die Busse warden innerhalb einer 
PAE in die Teilbuese getrennt und in den SIMD-ALUs (1213, 1214) getrennt 
verarbeitet. Die gemeinsamen Handshakes steuem die Ablaufsteuerung (1215) 
S der PAEs an I bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarbeitung, bei welcher sSUntliche Busse 
vollkommen getrennt sind (1221) getrennte Handshakes (1222) aufweisen. Die 
Busse in den SIMD-ALUs (1223, 1224) getrennt verarbeitet. Die getrennten 
10 Handshakes steuem die Ablaufsteuerung (1225) der PAEs an, bzw. werden von 
dieser generiert. 



Einsatz von FPQAb als ALU-Core 
15 In PACT13 ist bereits eine Architektur beschrieben, in welcher anstatt einer 
ALU eine FPGA oder FPGA-ahnllche Struktur in eine PAE integriert wird. Diese 
Struktur wird innerhalb einer PAE gem&fi den PPGA Konfigurationsmethoden nach 
dem Stand der Technik konfiguriert, d. h. die erweiterten 

Konfigurationsverfahren nach PACT02, 04, 05, 10, 13, 17 finden auf die FPGA- 
20 Struktur keine Anwendung. Dadurch sind Auf wand und Kosten far die 

Konfigurationssteuerung der verhaitnismafiig kleinen FPGA-Zellen gering. Die 
PAB allerdings, die, die FPGA-Zellen enthait, verhait sich gexn^fi des VPU- 
Konfigurationsverfahrens nach den o. g. Schriften. Dadurch- ist die FPGA- 
Stniktxir in der PAE-Struktxir gelcapselt und verhait sich wie ein PAE-Objekt 
25 mit vielen Konf igurationsregistem. 

Dadurch lassen sich auch beliebige Qperationen auf ein Array aus FPGAs 
abbilden. Gemafi DE 101 35 210.7-53 ist eine Mischung aus ALU-PABs und FPGA- 
PAEs iimerhalb einer VPU mOglich und d\archaus sinnvoll. 

30 Es ist anhand des Anwendungsgebietes zu entscheiden, ob ein mehrfacher Satz 
an Konfigurationsregistem fttr die FPGA-Zellen sinnvoll ist, da deren Anzahl 
sehr hoch ist. Gegebenenfalls werden Konfigurationsregister zuxn schnellen 
Ctokonfigurieren einer FPGA-PAE geinafi DE 196 51 075.9-53 , DE 199 26 538.0 
und insbesondere DE 100 28 397.7 Fig. 18 und 19 als Register-Pile oder FIFO- 

35 Struktur innerhalb der PAE realisiert und von dort aus in die PPGA-Zellen 
geladen . 

Es hat sich mittlerweile als besonders vorteilhaft herausgestellt, wenn 
innerhalb einer ALD-PAE eine FPGA Striiktur der ALU zugeordnet wird, indem die 
40 FPQA-Struktur vor \and/oder nach und/ oder parallel zur ALU angeordnet wird. 
Bevorzugt ist eine AusfOhrung in welcher die FPOA-Struktur der ALU 
nachgeschaltet wird. 

Der Vorteil liegt darin, dass nur relativ kleine FPGA-Strukturen verwendet 
werden mttssen, da samtliche arithmetischen Operationen weiterhin in der ALU 
45 ablaufen. Dadurch wird eine besonders hohe Kos ten/Performance Effizienz 

erreicht. Urn kleine Wortbreiten zu unterstUtzen (4-bit, 8-bit, etc.), bietet 
es sich besonders an, die vorab beschrlebenen SIMD-ALUs einzusetzen. 
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Durch die Nachschaltung von FPQA-Strukturen hlnter elner ALU lassen sich 
Insbesondere Correlator en und PNG-Generatoren besonders e££izient aufbauen. 

Der Einsatz von VPU Architekturen bietet sich mittlerweile' insbesondere ftlr 
5 den Ersatz von ASICs bei mittleren und niederen Stackzahlen an. Dieses 
Einsatzgebiet der VPU Bausteine weiet die Beeonderheit auf , dase die 
Applikationsfelder sehr klar da£iniert sind und hclufig nur einige wenige 
i^plikationen au£ den Bausteinen ausgefflhrt werden. Besonders diese 
Einsatzgebiete ben^Jtigen hHufig feingranulare PPGA-Strukturen zxxr bitweisen 

10 Verarbeitung von Da ten. 

Durch die Limitierung au£ wenige Anwendungen sind hier die mttglichen 
Konfig\irationen der FPGAs ebenfalls sehr begrenzt und vorhersagbar . 
Es wurde erkannt, dass es bei spiel sweise insbesondere £ttr diese 
Einsatzgebiete lohnend ist, die Rekon£iguration der FPC3A-Strukturen von der 

15 schnellen Rekonf iguration der grobgranularen Strukturen abzusetzten. Mit 

anderen Worten werden ftlr die FPGAs langsamere (z. B. herkeonmliche serielle) 
Rekon£igurationsver£ahren verwendet, die Aufierst kosten- und £l£lchene££izient 
realisierbar sind. 

Dazu kann (1) ein vollkomtoen separates Konfigurationssystem bestehend aus 
20 BuBsystem xind Kon£igurationskontrollem au£gebaut werden, wie dies von FPGAs 

nach dem Stand der Technlk bekannt ist. (2) kOnnen die 

Konf igurationsressourcen der VPU Technologie benutzt werden, ohne dass jedoch 
Ressource £fir besondere beschleunigende Massnafaxnen zur Verfagung gestellt 
werden. Bei spiel sweise kann der Zugriff auf den FILMO nach DE 196 54 593.5-53 

25 , DE 198 07 872,2 fUr FPGA-Stinikturen ausgeschlossen sein, ebenso wie das 

Vorhandensein von Kon£igurationsregisters tacks nach DB 100 28 397.7 oder wie 
nachfolgend beschrieben. Ebenfalls kann die UnterstUtzung der schnellen Wave- 
Rekonf iguration nach DE 199 26 538.0 , DE 100 28 397.7 entfallen. Es ist 
etwa mOglich, einen PPOA-Array eine PAB zur Xtokonfigurierung zuzuordnen. Hier 

30 mufi lediglich die PAE dazu konfiguriert werden, die FPGA-Struktur zu laden, 
was wie vorstehend beschreiben, durch PAE-gesteuerten, eigenstandigen Zugriff 
auf Da ten von atifien geschehen keum. 

Insbesondere bietet es sich aus Kostengrtlnden an eaistatt der mehrfach 
rekonf igurierbar en Architekturen ressoxircensparende "einmal konf igurierbaure ' 

35 Architekturen einzusetzen. Die VPU-Bausteine werden dann einznal vor ihrer 
Aus lief erung an den Kunden oder beim Kunden bzw. diirch den Kunden 
personalisiert, d. h. die FPGA-Strukturen werden auf ihre durchzuftlhrende 
Funktion konfiguriert. Die Funktion der FPGA-Strukturen ist sodann im 
weiteren unabanderlich, wahrend sfimtliche verbleibenden Funktionen, wie die 

40 der ALUs und deren Vernetzung, weiterhin vollstandig laufzeitrekonf igurierbar 
entsprechend der VPU-Technologie ist 

Als "einmal konf Igurierbare" Technologien bieten sich besonders die bekannten 
ROM, EPROM, EEPROM, FLASH basierenden Verfahren an. Es soli insbesondere 
erwahnt sein, dass sich die bekannten Fuse und Antifuse-Verfahren (z.B. 
45 Atmel, Actel, Quicklogic) besonders zur Realisierung derartiger •einmal 
progrananierbarer" FPGA-Strukturen eignen. 
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Auf den prinzipiellen Aufbau derartiger Strulcturen soil hier nicht welter 
elngegangen werden, da dieser diirch den elnschiagigen Stand der Technik, 
insbesondere den Patenten der o. g. Fiznten, hinreichend bekcmnt ist. 

5 Figur 8 zeigt beisplelhaft elne erfindungsgemaSe PAE. Dargestellt ist der 
Datenpfad der PAE. Die Verbindung zu dem Bussystem 0105 wird durch die 
bevorzugt Register enthaltende Eingabebaugruppe 0801 und 0802 und die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 realisiert. 
Der ALU (0804) nachgeschaltet ist eine Funktionseinheit aus feingranulsoren 

10 FPGA-Zellen (0805), die tiber einen Busstruktur miteinander verbunden sind. 
Der Ausgang von 0804 wird au£ diese Busstruktur aufgeschaltet, die 
• Busstruktur wiederum ist mit 0803 verschaltet. Optional und bevorzugt kann 
iDittels eines Multiplexers ein Bjypass des Ausgangs von 0804 direkt auf die 
Ausgabebaugruppe 0803 an 0805 vorbei geschaltet warden. 

15 In die FPGA-Zellen kflnnen mehrere Stufen Logik konfiguriert werden, 

insbesondere stotliche oder einige der folgenden Punktionen; Multiplexer, 
AND, OR, XOR, NOT Funktionen, Halb- addierer, Vergleicher, Schielaeregister, 
Register, Boolsche Lookup-Tabellen. 

Die FPGA-Zellen (0805) kdnnen durch den Konf igurationsbus (0404) der PAE 
20 konfiguriert werden. Bevorzugt werden besondere konf igurationsbeschleunigende 

Baugruppen, wie z. B. Konf igurationsstacks (0406) nicht zur Konf iguration von 

FPGA-Zellen benutzt. Diese Baugruppen werden ggf . ftlr derartige 

Konfigurationsdaten passiv geschaltet oder die Konf igurationsdaten wexrden an 

ihnen vorbeigeleitet . 
25 In einer besonderen Ausgestaltung ist eine perxnanente einxnalige Konf iguration 

der FPGA-Zellen tinter Verwendung von RDM-Elementen wie z. B. EPROM^ EEPROM/ 

Flash-ROM Oder Fuse-/Antifuse-Technologien vorgesehen. 

Figur 9 zeigt n^Sgliche erfindungsgemaSe Ausgestaltungen von PAEs. Es soil 
30 ausdrUcklich darauf hingewiesen werden, dass die Ausgestaltung in Figur 9a 
und die in Figur 9b auch gleichzeitig zusammen in einer PAE iinplementiert 
sein kannen. 

Figur 9a zeigt den Anschlufi eines Registerf iles (090X) (z.B. R0..Rn) an einen 
35 Kern (0902), der beispielsweise aus einer ALU wie 0804 oder einer ALU (0804) 
und PPGA-Zellen (0805) bestehen kann. 

Die Brgebnisdaten des Kerns werden zu den Registern 0901 geftihrt und dort je 
nach Operation eingespeichert . Die Register 0901 werden tlber Muliplexer 
(0903, 0904) je nach diurchzuftibrenden Operation auf die EingSnge der ALU 
40 geftthrt, 

Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zusatzliche 
Aufschalteinheit (0911) fttr einen dedizierten globalen Bus (0912) (z.B. 10- 
Channel) itiqplementiert ist. Die Brgebnisdaten des Kerns werden zu der 
45 Aufschalteeinheit 0911 geftihrt und dort je nach Operation auf den globalen 
dedizierten Bus (0912) tibertragen. PUr die PAE bestimmte Daten von 0912 
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werden tlber Muliplexer (0903, 0904) je nach durchzufOhrenden Operation auf 
die Elngange der ALU geftihrt. 

Optional kann die Auf schalteeinheit 0911 Ober die Basaufschalteeinheiten 0913 
und 0914 Daten direkt von dem Bussystem 0105 lesen Oder auf dieses 
5 tibertragen. 

Figur 10a zeigt die Verwendung von dedizierten globalen Bussystemen innerhalb 
eines Arrays aus PAEs (1001) . Insoweit entspricht die Darstellung des PAs aus 
Figur 1 (0101) . Jeweils eine Menge von PAEs (1001) ist an die globalen 

10 dedizierten Buseysteme 1002, 1003, 1004 angeschlossen luxd kann Daten auf 
diese Senden oder von diesen Eta^fangen. Die Datenfkbertragung kazm sowohl 
zwischen den PAEs, als auch zwischen PAEs und 10 stattfinden. Bs ist 
dargestellt, dass PAEs auch an mehrere globalen dedizierten Bussysteme 
gleichzeitig angeschlossen sein kOnnen, wflhrend andere PAEs m^licherweise 

15 keinen Anschluss aufweisen. 

Figur 10b zeigt beispielsweise den AnschluS eines globalen dedizierten Busses 
(beispielsweise 1002 oder 1003 oder 1004), der innerhalb des Arrays aus PAEs 
(0101) mit einigen PAEs (1001) verbunden ist, an aufierhalb des OlOX liegende, 
ggf . auch bausteinexteme Baugruppen. Die Baugruppen ktfnnen beispielsweise 

20 Peripherie (1011) und/oder Speicher (1012) sein. Zum Anschlxifi der auSerhalb 
liegenden Baugruppen (1011, 1012) kann ggf. eine Anpassung der Signtae (z. B. 
Spannungen: CMOS, TTL, LVDS, etc.) stattfinden. 

Figur 10c zeigt ein Beispiel fttr den Anschliifi eines globalen dedizierten 
25 Busses (beispielsweise 1002 oder 1003 oder 1004) , der innerhalb des Arrays 
aus PAEs (0101) mit einigen PAEs (1001) verbunden ist, an eine interface- 
Baugruppe (1021) . Die Interface-Baugruppe Obersetzt die Protokolle und/oder 
Signale des Intemen dedizierten Busses auf einen oder mehrere aufierhalb 
liegenden Busse. In dem aufgezeigten Beispiel sind 2 auSerhalb liegende Busse 
30 (1022, 1023) iinplementiert. Die Bussysteme sind bevorzugt unterschiedlicher 
Ausgestaltung, beispielsweise kann 1022 ein Speicherbussystem fttr Speicher 
(1024) vie SDR-RAM&, WR-RMSa, RAMBUS o.A. sein, wdhrend 1023 ein 
Peripheriebussyetem ftlr Peripherie- und/oder lO-GerSte (1025) darstellt, wie 
z. B. PCI Oder ein serielles Protokoll wie USB, FireWire, Ethernet. 

35 

Konfiauration koroolexe r Rechenwerke 

Komplexe Rechenwerke (z. B. Floating-Point Rechenwerke) kOnnen durch die 

geeignete Verschaltimg und Gruppierung von konfigurierbaren Zellen (PAEs) 
40 mOglicherweise auch \mterschiedlicher Bauart (RAM- PAEs, ALU- PAEs, Bussen) 
realisiert werden. 

Beispielsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltung von mehreren ALU- PAEs, die die arithmetischen Operationen tiber 
Exponent und Mantissa durchftlhren erreicht werden. Bevorzugt werden den ALU- 
45 PAEs die in der VPU des Anmelders (XPP-Technologie) integrlerten Forward- und 
Backward-Register (FREG/BREQ) zugeordnet, um die notwendigen Normierungen 
diirch Schiebeoperationen der in den FRB6/BRBQ angeordneten Barrel -Shifter 
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durchzuftUiren. Deanit lassen slch Floating-Point Rechenwerke bei Bedarf auf 
Basis der Integer-ALUs mit hoher Piachenef f izienz aufbauen. 
Bin Vorteil des Verfahrens liegt darin, dass keine Silizium-Fiadie fUr fest 
integrierte Floating-Point Rechenwerke veirwendet warden muss. Da Floating- 
5 Point-Operationen relativ zu den Integer-Operationen nor selten g^braucht 
wird, steigt damit das Kos ten/Nut zen- Verbal tnis erheblich an. 
Compiler, die Hochsprachenprogramme auf eine VPU tibersetzeui k&nnen durch 
Kakroexpansion \ind/oder mittels Lauf zeit-BibliotheJcen entsprechende 
vorgefertigte kotnplexe Strukturen in den Maschinencode (z. B. MHIi) 
10 libemehxnen. 

FUr Haschinencode-Prograinme (z. B. NML) bieten sich besonders Iiibrary-Calls 
au£ Bibliotheken an, die die entsprechenden koxnplexen Funktionen vorgefertigt 
en thai ten. 

15 

Stabemachlnes tiber RAM-PAEs 

Hit einem Array aus PAEs verbundene RAM-PAEs kCSnnen ziim Aufbau von Sequenzem 
eingesetzt werden. Das Orundprinzip beruht darauf , dass Ausgangsdaten eines 
J^peichers auf dessen Adreeseingang zurUckgekoppelt wird. Die RQckkopplung 
20 erfolgt bevorzugt tlber ein taktgesteuertes Registers. Dadurch entsteht ein 
Sequenzer, dessen jeweils nachfolgender Zyklus durch den jeweils aktuellen 
Zyklus vorgegeben ist. 

Teile der Ausgangsdaten (CONTROL-Signale) kOnnen nunmehr an andere Baugruppen 
und/oder Funktionszellen (PAEs) und/oder auch an exteme Gerftte abertragen 

25 werden, um dort bestixomte Vorg^nge auszuldsen. Besonders bevorzugt sind zwei 
Obertragtmgsarten, die zuneist gemeinsam angewendet werden: 
a) die tJbertragung Qber einen Datenbus, bevorzugt inbesondere als SIMD-Bus 
gemas der vorstehenden Eriauterung ausgeataltet, wodurch eine teilweise 
t)bertragung der Ausgangsdaten besonders effizient realisierbar ist. 

30 b) die Obertragung tiber einen Triggerbus, dessen bevorzugte Ausgestaltung und 
Arbeitsweise in PACT08 beschrieben ist. Ober Triggerbusse k6nnen Zustande und 
Bedingungen zur Ablaufsteuerung von Baugruppen und/oder Funktionszellen 
(PAEs) und/oder auch extemen OerMten besonders effizient Qbertragen werden. 

35 Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie 
folgt(Darstellung: ht^herwertige Bits ... niederwertig Bits): 
Adresse: 



Adresse des aktuellen Zyklus 



Daten: 

Adresse des nachsten Zyklus I CONTROL-Signale 



40 



Es bleibt zu erwahnen, dass die Eingangsdaten typischerweise nicht verwendet 
werden, d.h. auf den Speicher wird nur lesend, nicht schreibend zugegriffen. 
Der Inhalt des Speichers (z.B. RAM-PAE) wird durch eine Konfigxirationseinheit 
vorkonf igurier t . Deshalb kann der Speicher insbesondere auch als 
45 nichtflttchtiger einmal programmierbarer Speicher mit ROM, BPROM, EEPRQM, 

40 
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Flash Zellen oder basierend auf Fuse Oder Antifuse Technologien aufgebaut 
sein. Der Spelcher wird dann, wle vorab bereite beschrieben, vor der 
Auslleferung an den Kunden oder bein Riinden personal islert« d.h. 
programmiert . 

5 

Ein Speicherzugrif f durch andere PAEs ist grundsatzlich mfiglich, \m den 
Sequenzer z.B. im Betrieb zu modlfizieren, soli aber aufgrtind des begrenzten 
Einsatzbereichs bier nicht welter detailliert ausgeftShrt werden. 

10 Der erf indungsgemafie Sequenzer kann durch folgende Brweiterxingen in seiner 
Abfolge von Zy3aen auf Erelgnisse reagieren und insbesondere bedlngte SprOnge 

durchf ahren : 

Ein Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Spelcher 
wird als Eingang fUr weitere Zustandsslgnale verwendet. Dlese Zustandssignale 

15 kOnnen durch die vorstehenden ttoertragungsarten tUoertragen werden und somit 
Daten oder Trigger sein. Bei der Selektion des nachfolgenden Zyklus wird 
nunmehr eine roOgliche Menge von zyklen durch die Datenrttckkopplung auf die 
bevorzugt hohen Adresebits bestimmt und der bestimmte Zyklus wird dann aus 
der mfiglichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 



25 



Daraus reeultiert folgender Aufbau der Eingangsadressen, bzw. Ausgangsdaten 
wie folgt (Darstellung: hOherwertige Bits ... niederwertig Bits): 
Adresse: 

Adresse des I Zustandssignale 

aktuellen Zyklus 



Daten: 

Adresse des nftchsten Zyklus | CONTROL-Signale 



30 



40 



Somit ist ein vollwertiger Sequenzer definiert, der den Grundprinzipien der 
Uealy-Moore Sequenzem entspricht. 



Die Zustandssignale und/oder Control- Signal e kOnnen nunmehr ggf . zu BOndeln 
zusammengefajSt derart gruppiert werden, dass je eine Qruppe bestimmten 
Sendem/Empfangern zur Verftigung steht, z.B. eine Gruppe ftlr 0101-inteme 
PAEs und eine Gruppe ftir exteme Baugruppen und eine Gruppe zmx 
35 Konf igurationseinhei t . 

Mit anderen Worten werden samtliche Sprtlnge durch die Angabe der "Adresse des 
nachsten Zyklus" realislert. Bedingungen werden durch die Zustandssignale 
realisiert . 



Das dabei auftretende Problem ist, wie sog, don't cares, also bestimmte 
zustandssignale, deren Wert zu einem Zyklus bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, fUr samtliche mOglichen Werte 
dieselben Daten festzulegen. 

41 
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Beisplel: 



Innerhalb einer f olgendermassen aufgebauten Adresse 



10 



Adresse des Zustandssignale 
aktuellen Zyklus 

soli die "Adresse des aktuellen zyklus" (Cycle) beispielhaft gleich 0x60, 
enteprechend cyCLE60 sein. Es sind 4 Zustandssignale (ZS0..3) vorgesehen, von 
denen innerhalb des beispielhafte Zyklus' 2 {ZS3 \ind ZSl) je nach Wert zu 
anderen Sprungzielen ftlhren, also beispielhaft nach CYCLEIO/ CYCLE?, CYCIiE89, 
CYCLESe . 

Die Tabelle sieht nunmehr wie folgt aus: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


zso 




CYCLESO 


0 


0 


0 




CYCLEIO 


CYCLESO 


0 


? 


1 


? 


CYCLE7 


CYCLE60 


1 


? 


0 




CYCLES 9 


CYCLE60 


1 


? 


1 


? 


CYCLES 6 



Die don't cares (ZS2, ZSO) werden nunmehr so belegt, dass der Wert ihres 
Signales keinen Einflufi auf die Zuordnung der Adresse zu den Daten hat: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


zso 




CYCLES 0 


0 


0 


0 


0 


CYCLEIO 


CYCLE60 


0 


0 


0 


1 


CYCLEIO 


CYCLB60 


0 


0 


1 


0 


CYCLE? 


CYCLES 0 


0 


0 


1 


1 


CYCLE? 


CYCLE60 


1 


0 


0 


0 


CYCLE89 


CYCLE60 


1 


0 


0 


1 


CYCLB89 


CYCLE60 


1 


0 


1 


0 


CYCLES 6 


CYCLES 0 


1 


0 


1 


1 


CYCLES 6 


CYCLES 0 


0 


1 


0 


0 


CYCLEIO 


CYCLE60 


0 


1 


0 


1 


CYCLEIO 


CYCLES 0 


0 


1 


1 


0 


CYCLE? 


CYCLES 0 


0 


1 


1 


1 


CYCLE? 


CYCLESO 


1 


1 


0 


0 


CYCLE89 


CYCLES 0 


1 


1 


0 


1 


CYCLES 9 


CYCLESO 


1 


1 


1 


0 


CYCLES 6 


CYCLESO 


1 


1 


1 


1 


CYCLES 6 



15 

Jeder Zielzyklus xst nunmehr 4-fach gespeichert, entsprechend alien binUren 
KombinationsmOglichkeiten der don't care. 



Eine weitere optionale, aber sinnvolle und daher bevorzugte 
20 AusaestaltungsmOglichkeit des Sequenzers sieht einen zusatzlichen Teilbereich 

42 



wo 03/036507 



PCT/EP02/10572 



der Ausgangsdaten fOr eine Selektor- und/oder Vergleichsniaske ftir die 
Zustandssignale vox. Bel der Verwendiuig als Selektor kfinnen z.B. durch die 
AnBteuenmg von Multiplexern durch die Selektormaske eine Teilmenge von 
Zustands signal en aus mehreren m<}glichen ausgewdhlt werden. Die zuseltzliche 
S cptionale Vergleichstnaske kann als Vergleichsoperator fUr einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Menge 
von Statusbite generiert. Ebenfalls kann die Vergleichsmaske zur Deselektion 
von don't care Signal en dienen, z.B. Ober eine normale Maskenoperation durch 
Vemndung nach dem Stand der Technik (siehe PACTIO) . 

10 

Der Aufbau der Ausgabedaten ist dann wie folgt: 



Da ten; 

Adresse des nachsten I CONTROL- Signale I selektor /Vergleichsmaeke" 

Zyldus 



15 

Ein bevorzugter Sequenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbua einer RAH-PAE, die als Sequenzer speicher verwendet wird, wird 
in mehrere Teiladressen beliebiger uod insbesondere jn5glicherweise auch 
unterschiedlicher Breite aufgeteilt, beispielsweise Bit 0..3 tiXr eine erste 
20 Teiladresse (NBXT^CYCIiE) , Bit 4.. 7 ftir eine zweite Teiladresse (SBQ_IN) und 
Bit 8.. 12 far eine dritte Teiladresse (CTRZ^XN) . 

Der Datenausgang einer RAM-PAE wird in mehrere Teildaten beliebiger und 
insbesondere m^licherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 fttr die ersten Teildaten (CYLCE) , Bit 4.. 7 ftlr die 
25 zweiten Teildaten (S£(L.ODT) und Bit 8.. 12 fllr die dritten Teildaten 
(CTRL_OOT) . 



Zur Auf teilung der Adressen und/oder Da ten kann insbesondere das beschriebene 
SIMD PAE- und Bus-Konzept verwendet werden. Weiterhin kann die Auftrennung 
30 innerhalb der RAM-PAS erfolgen, 

Der RAM-PAE kOnnen datenverarbeitende PAEs zugeordnet werden, wie z, B. AL0- 
PABs. 



35 Die Festlegung des nMchsten Zyklusses innerhalb eines Sequenzerdurchlaufs 
erfolgt durch die Rttckkopplung von NBXT^CYCLB auf CYCaijE. 

In einer erweiterten Ausftihrungsvariante k^^nnen zusatzliche 
datenverarbeitende PAEs zur Berechnung von CYCLE in Abhflngigkeit von 
40 NEXT_CYCLE innerhalb der Rttckkopplung vorgesehen sein. Diese PAEs kOnnen auf 
beliebige, insbesondere auch zusatzliche Signale, Daten oder Zustande 
anderer PAEs und/oder extemer/ peripherer Baugruppen reagleren. Desweiteren 
kdnnen diese PAEs zusatzliche Signale oder Daten erzeugen. 
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Zur Realisierung eines erweiterten Sequenzers kOnnen weitere PAEs angekoppelt 
sein, die in elner mCglichen Ausgestaltung auch in ihrer Funktion und/oder 
Vernetzung vom Sequenzer beeinfliifit werden kOrmen. Dazu kann der Sequenzer 
Daten in die Konf igurationsregister der entsprechenden PAEs Ubertragen. Ein 
5 Zugrif f auf die Konfigurationsregister kann bei spiel sweise durch die in DE 
197 04 728.9 beschriebene Architektur erfolgen (vgl . DE 197 04 728.9, Fig. 
4) . Die angekoppelten PAEs verarbeiten vorwiegend Daten beliebiger Art \jnd 
besltzen Anschlufi an weitere PAEs, insbesondere datenverarbeitende (ALU-PAEs) 
und/oder Speicher-PAEs (RAM-PAEs) und/oder periphere Anschlttsse (lO-PAEs) . 
10 Diese PAEs kOnnen durch die durch SEO-OUT dargestellten Control- Signal e 
angesteuert werden und kdnnen bedarfsweise durch die an SEC2.IN geleiteten 
Zustandssignale Ablau£speicher des Sequenzers ansteuem. 

15 weitere mfiglicherweise auch unabhangige PAEs oder Einheiten, insbesondere 

auch exteme /periphere Einheiten und/oder tibergeordnete CTs kdnnen durch den 
Sequenzerspeicher entsprechend SBCL-IN/OUT auxgesteuert werden (CTRI»_OOT) oder 
diesen ansteuem (CTRL_IN) . 

20 

Zur korrekten taktgesteuerten Ablaufsteuerxmg des Sequenzers sind in 
RUckkopplungspfade bevorzugt taktsynchronlsierte Register eingebaut. 

Die RAM-PAE kann durch eine ttbergeordnete Konf igurationseinheit konfiguriert 
25 werden, insbesondere kdnnen die Sequenzer ftuiktionen durch den Znhalt der RAM- 
PAE konfiguriert und festgelegt werden, 

Es wurde als vorteilhaf t erkannt und wird fUr sich als patentfShig gehalten, 
dass mit einem Speicher ein einfacher Sequenzer ohne grofien zuefltzlichen 

30 Hardwareaufwand realisiert wird. Dies ist besonders leicht dadurch mOglich, 
dass zianachst der Inhalt einer Speicherzelle dahingehend ausgewertet wird, an 
welcher Stelle als nachstes ein Iiesezugriff erfolgen soil. Wenn dort wieder 
angegeben ist, wo als nSchstes ein Zugriff erfolgt, ist ein automatenartiges 
Durchlaufen realisierbar . Zugleich wird aber gemaiS der hier als vorteilhaft 

35 erkannten Ausgestaltung nicht einfach eine weitere Adresse ftlr den nachsten 
Zugriff ermittelt, sondern parallel dazu angegeben, was dabei zu tun ist; mit 
anderen worten werden an der Speicheradresse auch Daten oder Bef ehle 
mitabgespeichert. Dies kann dadurch geschehen, dass ein Teil der an einer 
stelle gespeicherten Information die Adresse ftir den nachsten Zugriff angibt 

40 und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 

weiteres mOglich, wenii die Breite der gespeicherten Daten aufgeteilt wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil . Weiter ist es sogar 
mOglich, nur einen Teil der im Speicher adressierbaren Speicherpiatze zu 
kodieren, etwa bei 12 bit Breite n\ir 8 bit zu verwenden. Dann k6nnen weitere 

45 Bits hinzugefUgt werden, hier vier, etwa durch Auswertung von Flags, 

Triggem, Zustanden, Oberiaufen etc. Dies hat den Vorteil, dass an die 
Speicherstellen, die dann exakt angesprochen werden durch Vorgabe der hier 
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Sbitigen ausgelesenen Adresse und der hier 4bit auswertegenerierten 
Information, unberschledliche Anweieungen gesetzt werden kdnnen. Ea sei 
darauf hingewiesen, dass entweder alle Trigger und die erf orderliche Reaktion 
hierau£ von vomeherein festlegbar sind oder dass altemativ auch zxamindest 
5 Telle der Reaktionen au£ einzelne oder alle Trigger wSlhrend der AusftUining 
einer Konf iguration variiert und/oder festgelegt werden kdnnen. Hierzu Icann 
eine Rllckkopplung au£ eine Triggemaskierung usw. vorgesehen sein. 

Dies erlaubt es, abhSngig von den ausgewerteten Informationen bedingte 
10 Sprttnge etc. zu generieren. Sind dabei von einer Reihe per se auswertbsurer 
Informationen nur wenige interessant, werden also aktuell im obigen Beispiel 
etwa nur 2 statt vier Bits bentttigt, so kann die Jewells in einer 
entsprechenden Spelchers telle angegebene Information an jenen Speicherstellen 
auch vorhanden sein, die sich nur \m nicht Interessierende Bits in Ihrer 
15 Adresse unterschelden . 

Figur 15 zelgt eln Ausgestaltungsbelsplel eines erf lnd\ingsgem£l£en Seguenzers 
basierend auf einer HAM~PA£. Eln Tell (1505) des Datenausgangs (1502) eines 
Spelchers (1501) ist Ober eln taktgesteuertes Register (1503) auf den 
20 Adresselngang (1504) des Spelchers zurQckgekoppelt. Der Adresseingang (1504) 
entsprlcht somit CYCLE und 1505 einem Tell, bevorzugt dem H6herwertlgen, von 
NEXTjCYCLE. 

. Optional kann eln Tell (1508) des Datenausgangs (1502) an eine Selektor- 
25 Haskenelnhelt (1509, 1510) gefUhrt werden, in welcher die vom Bussystem 0105 
als Daten und/oder Trigger elngehenden SEQ_IN (1511) bzw. CTRli_lN (1512) 
Daben vercurbeltet werden. 

CTRL^IN und SEQ_IN und/oder deren in der Selektor-Miaskenelnhelt vercurbeltete 
30 Werte werden zu 1505 dazugemischt (1513), bevorzugt derart, dass 1505 den 
hfiherwertlgen Adressteil und CTRL_IN/SEQ_IN den niederwertigen bilden. 

Der verblelbende Teil des Datenausgangs (1502) kann in einen SEQ_out- (1506) 
und CTRLjOUT (1507) Tell aufgetrennt werden und Uber die Ausgabebaugruppen 
35 0803a, b als Daten und/oder Trigger auf das Bussystem 0105 gefUhrt. 

Verschledene Konf Igurationsreglstermodelle zur Festlegung der Konflguration 
von jewel Is lokal zugeordneten PAEs sind bekannt. In PACT02 ist eln 
sequentiell abaxbeitbares Modell beschrieben, in PACT04 ist ein FIFO-Mbdell 
40 beschrleben, das ebenfalls sequentiell abgearbeitet und Ober 1 append 

konflgurlert werden kann, in PACT08 1st eln selektlves Modell beschrleben, 
bei welchem abhSngig von der Datenverarbeitung bestimmte 

Konflgurationsregister und damlt die in ihnen gespeicherte Funktion und/oder 
Vemetzxuig ausgewMhlt werden. In DE 100 28 397.7 1st welterhln ein FIFO- 
45 Modell beschrleben, das sich besonders fUr die Vorabkonf iguration imd 
liber lappende Konflguration elgnet. 
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Als besonders leistungsfShig und Kosten/ Performance effizient wurde eine 
Kischung aus diesen Modellen erkannt. 

Das FIFO-Modell nach DE 100 28 397.7 eignet sich besonders, um eine 
5 beliebige tazahl von Konf igurationaregistem von PAEs vorzuladen, da die 
Punktion des verwendeten FIFOs eine variable Konf igurationsiange effizient 
ermOglicht. Hierzu wird jeder PAE ein lokaler FIFO-Speicher zugeordnet, der 
die Konfigurationen seiner zugeordneten PAE verwaltet und puffert. 

10 Durch eine Erweitening, wie z. B. die nachfolgend beschriebene, des FIFO- 

Hodelles kann der Anfang und das Ende einer bestimniben Konfiguration und der 
dazugehttrenden einzelnen Konf igur at ions ein trftge festgestellt werden. Nunmebr 
kflnnen mehrere Konfigurationen zugleich in dem FIFO-Mtodell abgelegt werden. 

15 Als besonders geeignet zur Kennzeichnung des Anfangs Oder Endes von 

Konfigurationen haben sich die zwei nachfolgend beschriebenen Verfahren 
herausges tell t : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicherzelle: 
20 Jedem Konfigurationseintrag werden zusatzliche Bits zugeordnet, die den 
Beginn und/oder das Ende einer Konf igur at ion kennzeichnen. Beispielsweise 
kann ein Eintrag im FIFO wie folgt aussehen: 



Bit 0..1S 


Bit 16 


Bit 17 


Konf igurationswor t 


O=don't 

care 

IsBeginn 


O=don't 

care 

laEnde 


Da bevorzugt naoh dem nachfolgend beschriebenen Verfahren direkt auf den 
Beginn von Konfigurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige des Begizms verzichtet: 


Bit CIS 


Bit 16 




Konfigurationswort 


O=don't 

care 

l=Ende 





b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Befehle dekodiert werden: 
30 Bestimmte Bitkombinationen innerhalb des Konf igurationswor tes werden als 
Befehle dekodiert und erkannt: 

Beispielsweise kOnnten die folgenden Befehle implementiert sein: 
BEGIN : Beginn einer Konf igurat ion 
END : Ende einer Konf iguration 
35 Dieses Verfahren iet erheblich flexibler und leistungsf ahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einfachen Unterscheidung von Befehlen und Konf igtirationen kann ahnlich 
den CycIeBits ein Bit vorgesehen aein, das durch seinen Wert die Semantik der 
Koafigurationswortes bestinimt, beispielsweise wie folgt: 



Bit 0..X5 


Bit 16 


Da ten 


OsXnterpretation der Daben als 




Konfigurationswort 




l=Interpretation der Daten als 




Befehl 



5 Bine Konfiguration wird je Aufruf von ihrem Anfang bis zu ihrem Ende in die 
Konfigurationsregister elner PAE Obertragen. 



Durch eine optionale zusatzliche Obersetzungs- und Zuweisxmgsvorrichtung 
lc6nnen Zustftnde (z.B. Zustande der eigenen ALU imd/oder ein oder mehrere 
10 Trigger (vgl. DE 197 04 728.9 ) beispielsweise anderer PAEs) auf bestiramte 
Konfigurationen innerhalb des PIFO-Mbdells tibersetzt warden, Beispielsweise 
kann ein eintreffender Rekonfigurationstrigger auf eine bestinmte 
Konfiguration innerhalb des FIFO-Modells zeigen, die durch das Auftreten des 
Rekonfigurationstrigger dann konfiguriert wird. 

15 

Als Obersetzungs- und Zuwei stings vorrichtung kOnnen beispielsweise 
algebraische Berechnungen und/oder logische Verkntlpfungen und/oder bevorzugt 
Obersetzungsspeicher (Lookup-Tabellen) zum Einsatz kommen. 

20 Wenn verschiedene Konfigurationen in einer Oder fOr eine oder eine Reihe von 
PAEs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Information abgelegt ist, auf elnfache Welse dadurch zu verwalten/ 
dass die L^ngen der jeweiligen abgespeicherten Konfigurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konfigurationen unterschiedliche 

25 LSngen haben, etwa well bei bestiinmten Konfigurationen Busse und/oder 

Register, wie Vorwarts- und Rttckwartsregister konfiguriert werden inttssen und 
bei andere nur neue Funktionen der ALU einer PAE einzustellen eind, oder well 
gleichzeitig Konfigurationsinfonnation fttr zellexterne Einheiten mitverwaltet 
wird. 

30 

Es ist damit also mi^gllch, einen Quasi -Fifocharakter zu implementieren. Dann 
sollten Mittel zum Aufaddieren, insbesondere sukzessivem Aufaddieren von 
Konfigurationeiangen, sowie daftlr, bei tJberflQssigwerden bestimmter 
Konfigurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereiche freizugeben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
mOglich. 

Diese Anordnung kann verwendet werden, um in einer Zelle Konfigurationen zu 
verwalten bzw. wiederum einen Sequenzer zu implementieren. Wiederum kann so 
40 auf die Konfigurationen reaglert werden, dass sich Sprllnge etc realisieren 
laesen. Es sei darauf hingewiesen, dass oben bereits erwfihnt wurde, dass zur 
Realisierung von Sequenzem zwischen ALD-PAEs und/oder anderen 
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datenverarbeitenden Zellen mit jeweils gegebenenfalls erweiterter 
FunJctlonalltat und Spelcherzellen steuer (Command-) Lei tungen vorgesehen werden 
kOnnen. Es sei erwahnt, dass derartige Leitungen mit zugeordeten Steuerungen 
auch innerhalb einer einzelnen und ftir sich autark seqeunzerfilhigen PAE 
S vorgesehen sein kdnnen. 



Eine besonders bevorzugte Variante ist in Figur 14 dargestellt und curbeitet 
wie folgt: 

10 Eine Kette von Addierem wird derart miteinander verbunden, dass das Ergebnis 
(SUMMB) eines vorherigen Addierers (p) an einen nachfolgenden Addierer [p-t-l) 
als Operand weitergeleitet wird. Die Weiterleitung kann derart unterbrochen 
werden, dass anstatt des Ergebnisses eine 0 (Null) weitergeleitet wird. 
Als zweiter Operand ist jedem Addierer jeweils ein eigenes Registers 

15 zugeordnet, dessen Wert jeweils zur SXJMME der vorherigen Stufen addiert wird. 
Jede der Stufen reprasentiert eine Konfiguration im Konf igurations-PIFO ; in 
dem Register der jeweiligen Stufe ist die relative Startposition einer 
Konfiguration gespeichert. Die absolute Startposition l^t sich nun 
berechnen, indem samtliche relative Startpositionen der sich unterhalb im 

20 FIFO befindenden Konfigurationen aufaddiert werden. Dies geschieht durch die 
Addiererketten, wie auch aus der Pig. Ersichtlich ist. 



Hit anderen Worten ist die relative Position als unterste Konfiguration im 
FIFO diejenige, deren Eintrag am Nachsten zum Ergebnis ausgang der 
25 Addiererkette gespeichert ist. Sodann folgen alle weiteren relativen 
Positionen gem^fi ihrer Anordnung im FIFO. 



Die Kette wird an der Stelle durch einschleusen einer Null anstelle der SUMME 
unterbrochen, Ijei welcher die relative Position der selektierten 
Konfiguration erreicht ist. 

Das Ergebnis ist nunmehr der Offset zwischen dem Ziesepointer des FIFOs, der 
auf die unterste Konfigtiration zeigt, und der Startposition der selektierten 

Konfiguration. 

Somit ist die Sprungadresse zur selektierten Konfiguration einfach durch 
Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selektierten Konfiguration kann durch unterschiedliche 
Verfahren in der Obersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger kOnnen priorisiert und dekodiert werden. 
40 (b) Die eingehenden Trigger werden Ober eine Lookup-Tabelle tibersetzt und 
danach mOglicherweise priorisiert und dekodiert. 

(c) Es der Menge aller Trigger werden einige ausgewahlt, z.B. Ober 
Multiplexer, die sodann entsprechend (a,b) weiterverarbeitet werden. 

45 Es soli besonders darauf hingewiesen werden, dass ein Trigger auch ein Vektor 
(TRIG-V) sein kann, wie in PACT08 beschrieben. Der Vektor selbst kann zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 
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Konfiguration. Dies ist insbesondere daim wichtig, wenn eine Wave- 
Rekonflguratlon nach PACTOS, PACT13, PACT17 durchgeftlhrt warden soil, bei 
welcher bevorzugt ein mlt den Daten tUbertragener Trigger-Vektor die nSchste 
Konfiguration selektiert. 



Nach Oder wShrend der Konfiguration kOnnen Konf igurationen aus dem FIFO 
entfemt werden. Bevorzugt wird dabei die Referenzierung innerhalb der 
Obersetzungs- und Zuweisungsvorrichtung entsprechend angepas6t. 

10 

Weiterhin kann das FIFO->Modell un das Sequenzer-Verfahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwShnt zu 
sein, deren parallel e) oder bevorzugt das vorstehend bescliriebene erweitert 
werden. Dazu werden bei spiel sweise Sprdnge (GOTO), sowie zustandsabhangige 
15 xind bedingte Sprtinge (WAIT-GOTO, IF-GOTO) eingeftihrt. Sprtlnge kttnnen durch 
besondere CycleBits reprftsentiert werden, oder bevorzugt als Befehle 
ixnplementiert sein. 

Weiterhin kann ein Synchronisationsanzeigeverfahren verwendet werden, das 
20 anzeigt, wann eine bestimmte Konfiguration bzw. ein bestimmter Zyklus des 
Sequenzers beendet iet. Mit anderen Worten kann jeder Zyklus aus mehreren 
Konfigurationseintr^gen bestehen. Zur Kennzeicbnung kann bei spiel sweise nach 
DE 196 54 846.2-53 ein run/s top-Flag verwendet werden, wobei 'run' 
zusainmengehOrende Konf igurationseintrSge eines Zyklus kennzeichnet und 'stop' 
25 den ersten Eintrag eines nachfolgenden Zyklus; altemativ ist ist die 
Verwendxmg der vorstehend beschriebenen CycleBits in^^lich, die zwar eine 
etwas andere Semantik aufweisen, sich aber ansonst gleich verbal ten. 

Altemativ Oder zusdtzlich zu diesen Verfahren k5nnen auch die ebenfalls aus 
30 den frtiheren Anmeldungen des Anmelders bekannten Befehle WAIT und BEGIN oder 
bevorzugt die vorstehend beschriebenen Befehle BEGIN xmd END verwendet 
werden. 

Durch 'stop' Oder WAIT oder END wird das Ende eines Zyklus. gekennzeichnet, d. 
h. eine Konfiguration ist kon«)lett, kann ausgefUhrt und abgearbeitet werden. 
35 Nach Beendigung der Datenverarbeitung dieser Konfiguration wird der nclchste 
Zyklus ausgeft&hrt. 

Die Beendigung kann entsprechend seguentieller Prozessoren durch einen Takt 
{Instruktionssequenzing) definiert sein, und/oder entsprechend des 
40 Datenverarbeitungsprinzips der PACT-Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konfigurationssequenzing) durch ein Statussignal (z. B. einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Eintreffen eines Triggers •stop' 
45 tlbersprungen werden und die nachfolgenden Konf ig\irationen konf iguriert 

werden. Altemativ oder zusatzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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Optional kann ein FIFO nichb nur die loJcal zugeordnete PAE ansteuern, sondem 
auch weitere, insbesondere timliegende oder zur selben Konfiguration gehOrende 
PAEs . 

Optional kann der FIFO auch als eine dedizierte Einheit nach DE 196 54 846.2- 
53 ausgestaltet sein. 

Ausf tihrungsbeispiele : 

A) Ein ein tref fender Trigger wird iXber eine tJbersetzungs- und 
Zuweisimgsvorrichtung auf eine im FIFO liegende Konfiguration (Kl) tJbersetzt. 
Die Konfiguration (Kl) wird daraufhin in die PAE konfiguriert. Als Ende- 
Kennung kann beispielsweise ein WAIT-Befehl, ein EMD-Befehl oder das 
run/stop-Plag dienen. 

Ein nachfolgend eintref fender Trigger wird Ober eine Obersetzungs- und 
Zuweisungsvorrichtung auf eine andere im FIFO liegende Konfiguration (K2) 
tlbersetzt. Diese Konfiguration (K2) wird daraufhin in die PAE konfiguriert. 
Kl und/oder K2 kOnnen nach erfolgter Konfiguration in die PAE aus dem FIFO 
gelttscht werden. 

B) Ein eintref fender Trigger wird tlber eine tJbersetzungs- und 
ZuweisungBVorrichtung auf eine im FIFO liegende Konfiguration (K3) tibersetzt, 
die aus mehreren Zyklen {Cyl, Cy2, CyBa, CyBb, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAE konfiguriert und ausgefUhrt. Als Ende-Kennung 
kann beispielsweise ein WAIT-Befehl oder das run /stop-Flag dienen. 
Ein nachfolgend eintref fender Trigger, der das AusftUxrungsende des Zyklus 
anzeigt, bewirkt die Konfiguration und das Ausftihren von Cy2, Cy2 endet ndt 
zwei WAIT-GOTO-Befehlen (WAIT-GOTO (Trgl, Cy3a) ; WAIT-GOTO (Trg2, Cy3b) > 
(vgl. PACT04), dies bewirkt, dass auf zwei unterschledllche Trigger, die das 
AusfUhrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Trifft Trgl 
ein, wird im nachsten Zyklus Cy3a konfiguriert und ausgeftlhrt bzw. bei Trg2 
entsprechend Cy3b. 

Cy3a und Cy3b enden mit einem WAIT-GOTO (Trg, Cy4) . Bei eintref fen eines 
35 Trigger, der das Ausftttinmgsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konfiguration entsprechend konfiguriert und ausgeftlhrt. 

Cy4 endet mit einem WAIT-GOTO (Trg, Cyl) , wodurch bei eintref fen des Trigger, 
der das AusfUhrungsende des Zyklus anzeigt, der emeute sequentielle 
40 Durchlauf einer Schleife beginnen kann. Insoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum Ausftihren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaft, aber nicht 
zwingend ist. 

45 Durch Eintreffen eines Triggers (Trg-x) kann die Schleife terminiert werden. 
Existiert ein Eintrag fOr Trg-x in der Obersetzungs- und 

Zuweisungsvorrichtung kann die Schleife jederzeit abgebrochen wad die durch 

50 



wo 03/036507 



PCT/EP02/10572 



Trg-x in der Obersetzungs- und Zuweisungsvorrxchtung referenzierte 
Xonflguration (KX) ausgefOhrt werden. 

Existiert kein Eintrag, kann durch das explizite Verwenden von WAIT-GOTO 
(Trg-x, KX) Befehlen, z.B. zusainmen mit WAIT-GOTO (Trg, Cyl) in Cy4 die 
5 Schlei£e zu bestixnmte vorgegebenen AusftUirungszeitpunicten terminiert werden. 

Figur 13 zeigt beispielhaf t einen Aufbau eines Konfigurationsbusses zur 
Konfiguration von PAEs (1001) durch eine Konf igurationseinhelt (0106). Die 
Konfigurationseinheit sendet Konf igurationsdaten tiber ein Bussyetem 1301 und 

10 gg£. Ober mehrere Registerstufen (1303, 1304) zur Verbesserung des 

Frequenzverhaltens und Uber den Konfigurationsdatenbus (0404) an die PAEs 
1001. Jede PAE dekodiert die angelegten Adressen und reagiert, sofexu sie 
eelektiert wurde, auf die Datentibertragung des Busses. PAEs kOnnen ihrerseits 
Daten ttber 0404 Uber die Register-Hultiplexer-Stufen 1304 auf das Bussystem 

15 aufschalten und die Konfigurationseinheit oder optional andere PAEs senden. 
Dies geschieht jeweils durch Obertragung der Adresse der Einpfangseinheit. 
Die RUckCUsertragung der Daten an die Konfigurationseinheit erfolgt bevorzugt 
ebenfalls durch Registerstufen hindurch (1305), bis zum Dateneingangsbus der 
Konfigurationseinheit (1302). 

20 Die F^ktionsveise des Konfigurationsbusses ist ebenfalls in DB 101 42 904.5 
und DB 100 28 397.7 beschrieben, die zu Of fenbarungszwecken vollumfanglich 
eingegliedert sind. 

Figxir 14 zeigt den Aufbau eines erf indungsgemaSen FIFO-Modells zur Steuerung 
25 der Rekonf iguration; hierbei wird darauf hingewiesen, dass sich insbesondere 
durch die Bef ahlgung zur Durchftlhrung von Sfprflngen das hier prUsentierte 
Fifo-Modell von reinen Fifos aus dem Stand der Technik unterscheiden kaim. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
weil diese vom typischen, sprungfreien Betrieb ein besonders anschauliches 
30 Bild assoziieren lafit. Diese Einheit ist optional zu alien, insbesondere den 
in dieser Anmeldungen beschriebenen, rekonf iguierbar en Zellen (PAEs) und in 
Figur 4 als Einheit 0406 dargestellt. 

Ein Speicher 1401 enthalt die Konf igurationsdaten ftir die zugeordnete PAE. 
1402 ist der Konfigurationsdatenausgang zu den Konf igurationsregistem der 

35 PAE (0405). tlber 1403, d.h. den Bus 0404, schreibt die Konf igxirationseinheit 
Konfigurationen in den Speicher, die jeweilige Adresse wird durch den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang um den Wert 1 
verandert wird, je nach Arbeitsweise des FIFOs inkrementell oder 
dekrementell . Ein S tar tadr ess -Pointer (1404) zeigt auf den ersten 

40 Konfigurationsdateneintrag im Speicher, wahrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu ttber tragenden, 

Konfigurationsdateneintrag zeigt. 1405 wird mit jeder DatenUbertragung aus 
dem Speicher an die PAE um den Wert 1 verandert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die Daten(tt)ertragung findet so lange 
45 statt, bis das Ende der Konfiguration von einer 

Konfigurationsendeerkennungseinheit (1409) erkannt wird, beispielsweise 
anhand eines CycleBits oder Befehls (WAIT, Em), 
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Der realislerte FIFO entsprlcht nlcht den nonnalen FIFOs nach dem Stand der 
Technik, die nur den Pointer 1405 aufwelsen. Die Hodifilcation ermOglicht das 
Lesen belieblger Konflgurationsdaten aus dem Speicher, wdhrend durch den 
Pointer 1404 verhindert wird, dass evtl. noch bendtigte Konfigurationsdaten 
S ttberschrieben werden. Dies geschieht durch das Erzeugen eines Full-Flags 
durch den Vergleich (1406) des Star tadr ess -Pointers 1404 mit dem 
Schreibzeiger (1407) . Wenn der Speicher vol! ist, werden Schreibvrersuche der 
Ronfigurationseinheit zurdckgewiesen, dies kann bevorzugt durch das aus 
PTICTIO bekannte ACK/REJ-Protokoll erfolgen. Der Vergleicher 1406 gibt dazu an 
10 seinem Ausgang 1416 ein entsprechendes Reject-Signal an die 
Konfigurationseinheit aus bzw. gibt kein Ack aus. 

Ein beispielhafter Speicher inhalt von 1401 ist mit 1408 gezeigt. Der Speicher 
enthait 5 Xonfigurationen (C0..C4). 1404 zeigt als Startpointer auf die erste 
IS Konfiguration CO. In diesem Beispiel zeigt 1405 auf den Beginn von 

Konfiguration C3. Die Zeigerposition berechnet sich aus dem Wert von 1404 
plus der Lange der Konfiguration CO plus der L&ige der Konfiguration CI plus 
der Lflnge der Konfiguration C2. 

20 Eingehende Trigger (1431) werden (iber eine in Figur 14a dargest elite 

tJbersetzungs- und Zuweisungseinrichtung (1432) auf Selekt-Signale (SCO. .n, 
1433) tlbersetzt, die die Adressierung der Konf igxirationsdaten im Speicher 
steuem. Diese Obersetzungs- md Zuweisungseinrichtung kann fest vorgegeben 
ihre Zuweisung vomehmen, ist €0:>er bevorzugt wc^end der Abarbeittmg einer 
25 Konfiguration veranderlich, wozu geeignete RUckkopplungen, Signal lei tungen 
etc. vorzusehen sind. Besonders wenn die tJbersetzungs- und 
Zuweisungseinrichtting verSnderlich ist, wird es bevorzugt, auch und/oder 
zusatzlich die der Zuordnung dienende Einheit 1434 wdhrend der 
Datenverarbeitung verflnderlich zu gestalten. Auch hierzu sind entsprechende 
Schaltungsanordnungen vorzusehen, wobei die Vertoderxing der Zuordnung 
insbesondere prograxnmgesteuert ablaufen kann. Eine entsprechende, 
insbesondere programmgesteuerte Verdnderung ist auch ftlr die Einheit 1414, 
d.h. das Adressberechnungsadditionskettenmittel mttglich. Die diese 
Aktualisierung und/oder neue Verbal tensweisen ausIOsenden Befehle werden 
bevorzugt in der Speichereinheit 1401 hierfUr abgelegt. 

Je ein Register (1411), ein Addierer (1412) und ein Nullgenerator (1413), 
hier beisplelhaft realisiert durch eine bitweise ttad-Punktion, bilden ein 
Glied einer Kette (1414) zur Adressberechnung. Je ein Glied verwaltet den 
Offset einer Konfiguration. Die Aneinanderreihung der Glieder entspricht der 
Aneinanderreihung der Konfigurationen im Speicher 1401. Mit anderen worten 
wird entsprechend des Beispiels 1408 das erste Glied die LSnge der 
Konfiguration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
um auf die Konfiguration CI zu zeigen. Das zweite Glied welst die IiMnge der 
Konfiguration CI auf, also den Offset der auf den Offset von CO und auf 1404 
addiert werden muss, um auf die Konfiguration C2 zu zeigen. Das dritte Glied 
weist die Lfinge der Konfiguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CI und auf 1404 addiert werden muss, urn auf die 
Konflguratlon C3 zu zelgen. Und so waiter. 

Es wird anhand der AusfUhrung ersichtlich, dass eine Kette von Additionen 
entsteht, deren Gliederanzahl der Position der Konfiguration im Spelcher 
5 entspricht. Dies wird durch die Kette 1414 wie folgt realisiert: 

Cber den Addierer wir jeweils der im Register gespeicherte Wert^ also die 
LSnge der jeweiligen Konfiguration, zu dem Ergebnis des vorherigen Gliedes 
dazuaddiert. Der Wert am Bingang der bitweisen Xftid-Fxinktion wird mit alien 
Ergebnisbits des Addierers venindet. 1st der Eingang also gleich 0, liefert 
10 die Und-Funktion eine BinSre 0 am Ausgang, urn die Addiererkette bei der 
auszuwflhlenden Konfiguration abzubrechen, aneonsten den Wert des 
Addierersausgangs . 

Mit anderen Worten ist in die Register (1411) die Grttfie der Konf igurationen 
15 in ihrer Reihenfolge im Speicher (1401) eingetragen. Die Selektsignale sind 
derart auf die Null -Genera tor en gefUhrt, dass die Konfigurations-GrOfien bis 
zur Startadresse der durch die Trigger (1431) referenzierten Konfiguration 
auf addiert werden. 

20 Sorait addiert die Kette alle Lflngen von Konf igurationen/ die vor der zu 

ladenden Konfiguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durch Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konfiguration zeigt. 

25 Die beschriebene Schaltung ist besonders leist\mgsfahig, da sie die 

Berechnung des Offsets und den Sprung innerhalb eines Taktes enn£Jglicht, 

In einer zweiten optionalen Kette (1421) kOnnen in Registem (1422) Befehle 
an die Konfigurationseinheit und/oder die PAB und/oder den 

30 Konf igurationss tack gespeichert werden. Eine Null funkt ion (1423), hier 

ebenfalls beispielhaft entsprechend der Nullfunktlon 1413 realisiert, liefert 
eine Binare 0 in an ihrem Ausgang, sofem das Selekt-Signal nicht aktiv ist, 
d.h. die Konfiguration nicht ausgewShlt wurde, ansonsten den Regis terinhalt 
(1422), also den Befehl. tJber eine Oder-Kette (1424) werden alle NUll- 

35 FunktionsausgSnge miteinander verodert, sodass der Befdil im Register 1422 
der aktuell selektierten Konfiguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum Ldschen von KintrSgen im Speicher (1401) dienen, 
d.h einer der mfiglichen Befehle kann sein, dass bestimmte gespeicherte 

40 Kpnfig\irationen gelOscht werden sollen bzw. zum Oberschrelben freigegeben. 
Dies kann z.B. durch den Befehl FIiUSH erfolgen, der den Startzeiger (1404) 
mit dem Lesezeiger 1405 ladt und somit alle vor dieser Adresse liegenden 
Daten zum tJberschreiben freigibt. Dies ist insofem bevorzugt, als die so zu 
ttberschreibenden Konf igurationen im fifoartigen Speicher i.d.R. alter sind 

45 und daher typlsch tiberschrieben werden k^Jnnen, wahrend die jUngeren 

Konf igurationen, die of tmals noch bentttigt. werden, weiter oben im quasi 
fifoartigen Speicher liegen werden. Bin welterer bevorzugt laplementierter 
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Befehl ist, dass neue Konf igurationen geladen werden sollen; dies ist dann 
wichtig, wenn das Br£ordemls, eine bestlinmte neue Konflguration zu 
benOtigen, mit einer zumindest nicht geringen Wahrscheinlichkeit vorhergesagt 
werden kann. Dieser Befehl kann an eine zentrale 
S Konflgurationsverwaltungseinhelt oder dergl. abgegeben werden; die 
Direktladxing ist gleichfalls mOglich, etwa bei Zuordnung von 1/0- 
Mdglichkeiten. Auch ist es bevorzugt, wenn sowohl der 
Konfigurationsanforderungsbefebl als auch der Flush- bzw. 
Altkonfigurationspreisgabebefehl siraultan ausftlhrbar und/oder speicherbar 
10 sind. Es sei erwdhnt, dass derartige Be£ehle wie Plush, Laden oder 

Plush/Laden auch in anderen Speicherbereichen bzw. -einheiten wie etwa 1401 
ablegbar sind iind daftlr nicht zwingend eine dedizierte Einheit wie 1421 
vorzusehen ist. Diese Verwendung einer per se bereits vorhandenen Einheit 
kann hardwareiaSU^ig bevorzugt sein. 

15 

Weiterhin kann der Befehl Uber das Bussysten nach Figur 13 an die 
Konfiguratlonseinheit gesendet werden (1426) . Beispielsweise kann der Befehl 
dort den Start einer bestinimten Konflguration auslOsen und/oder das Vorladen 
einer Konflguration bewirken. 

20 

FLUSH, also das LOschen von Konf igurationen ist einer der wesentlichen 
bevorzugten Befehle der EdLnheit. Einerseits ist der Befehl sehr vorteilhaft 
fOr die AusftUirung, andererseits weist er das Problem auf, dass sich bei 
dessen Ausftthrung s&ntliche Adressen und Referenzen verAndem. 

25 Der FIFO wird "gef lushed- , indem der StartPointer (1404) auf eine neue 

Startadresse gesetzt wird. Diese wird wie in Fig. 14 dargestellt bevorzugt 
auf den Beginn einer gespeicherten Konflguration gesetzt, wobei der Beginn 
durch die vorab beschriebene Berechn\ing mittels des Offsets bestinimt wird. 
Altemativ oder zusatzlich kann der Zeiger auch auf einen bestinmten anderen 

30 Wert z.B. eine an den FLUSH-Befehle gekoppelte Konstante gesetzt werden. 
Weiterhin massen die beiden Ketten 1414 und 1421 «gef lushed" werden, damit 
die Adressberechnung der ge&iderten Positionen der Konf igurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 nicht 
eingezeichnete) ^Itiplexer (1451), durch die die Registerdaten derart 

35 vorwartsflbertragen werden, dass die nxinioehr leeren (*geflushten*) Glieder der 
Kette mit den Daten der nachfolgenden Glieder tiberschrieben werden, und zwar 
derart, dass a) die Reihenfolge der Daten in der Kette unverdndert bleibt und 
b) das erste Glied der Kette mit neuen Daten belegt ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne Llicke in die Glieder nachfolgend 

40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewiesen, 
dass Ober die Multiplexer 1451 auch Daten betref fend die Konf igurationsgr6fie 
von aufien an die entsprechenden Stellen (Size of Config l..n) geschrieben 
werden kOnnen. Es ist dabei abzuschatzeh, aber aus Grfinden der 
ZeichnungstSbersichtlichkeit nicht dargestellt, dass jede Stelle einzeln 

45 ansprechbar bzw. adressierbar ist. Verwiesen wird insoweit auf die in 1434 
dargestellte Einheit 1435, die diese Stelle jeweils bestimmt. 
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Durch die Verschiebvmg innerhalb der Ketten sind nuiuuehr die Selekt-Signale 
(SCO..n) an die neue Lage der Daten in den Ketten anzupassen, damit wieder 
eine korrekte Zuordnung der Selekt-Signale zu der of fsetberechnung entsteht. 
Grundsatzlich stehen dazu mehrere Methoden zur verfttgung. Beispielsweise 
5 kOnnen 

a) Signale nach 1432 in 1434 binar kodiert (entsprechend der Punktion eines 
74LS148> werden, ein Offset, der der durch Plush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entetandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74LS139) urn die Selekt-Signale 1433 zu 

10 generieren; 

b) Signale nach 1432 in 1434 mittels einer Iiookup-Tabelle auf die Selekt- 
Signale 1433 ttbersetzt werden. Dazu ist die Lookup-Tabelle der durch Flush 
veranderten Positionslage in den Ketten anzupassen. 

Ein besonders bevorzugtes Verfahren fttr die Obersetzung der Signale soil 
detailliert beschrieben werden und entspricht der in 1434 eingezeichneten 
Vorrichtung: 

Ein erstes Schiebereglster (1435) enthait als einen Ein-Bit-Wert die Position 
des aktuell ersten freien, also unbenutzten, Gliedes in den Ketten 1414, 
1421, Dies geschieht folgendermafien: Nach einem Reset wird das 
niederwertigste Bit im Schiebereglster auf 1 gesetzt (dargestellt durch einen 
geftillten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Glied 
in den Ketten referenziert. Mit jedem Schreibzugrif f auf die Ketten^ also mit 
jedem neuen speichem (FILL) einer Konf iguration nach 1401 schiebt das 
Schiebereglster das gesetzte Bit (PBIT) urn eine Position in Richtung des 
hOchstwertigen Bits und referenziert dainit auf das jeweils nachfolgende Qlied 
in den Ketten. Das hOchstwertige Bit referenziert somit auf das hOchste Glied 
in den Ketten, also ist das Schiebereglster so breit wie Olieder in den 
Ketten vorhanden sind. Mit jedem FL0SH schiebt das Schiebereglster das Bit 
(PBIT) um genau so viele Positionen wie Glleder in den Ketten gelOscht wurden 
in Richttaig des niederwertigen Bits, 

Die Obersetzungs- und Zuweisungseinrichtung (1432) tlbersetzt bei der PAE vom 
Bussystem (0105a, Fig. 4) eingehende Trigger derart, dass je Trigger ein 
35 genau ein Signal des ausgehenden Busses (1437) gesetzt 1st. Jedem Signal ist 
ein Schiebereglster (1436) derselben Gr6&e wie 1435 zugeordnet. Es sind also 
eine Vielzahl von Schiebergistem 1436 (vorliegend dargestellt 1436a. . .1436c) 
vorhanden, wobei deren Anzahl der Anzahl der maxixnal zulftssigen 
iinterschiedlichen Triggersignale entspricht und deren LSnge d.h. Bitbreite 
40 der Anzahl der maximal zuiassigen Konfigurationen entspricht, also der Anzahl 
der Kettenglieder entspricht. Beim neuen Speichem einer Konf iguration (PILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete, Trigger 
zeigt; dargestellt durch einen Kreis. 
45 Bei einem Auf t re ten des Triggers auf dem Bus liefert das entsprechende 

ttoersetzte Signal (1437) einen 1-Wert, wahrend alle anderen Signale einen 0- 
Wert lief em. Die Signale 1437 werden jeweils an NUllgeneratoren (1438), 
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aufgebaut aus einer bitweisen Und-Pxanktion gefUhrt. Alle Null genera toren 
deren Eingangssignal von 1437 einen 0-Wert aufweiet, liefern einen Nullvektor 
am Ausgang. Der Nullgenerator, dessen Eingangssignal von 1437 einen 1-Wert 
aufweiet, Ubertr^gt den Inhalt des Schieberegisters 1436. Die AusgSnge aller 
5 Nullgeneratoren werden miteinander verodert (1439), sodass die Selekt-Signale 
SCC.n (1433) entstehen. 

Durch diese Funktion zeigt nunmehr ein eingehender Trigger Ober die 
Nullfunktionen auf ein Schieberegister 1436, dessen gesetztes Bit wiederum 
10 auf ein Glied in der Ketten (1414, 1421) zeigt. 

Bei einem Flush schieben die Schieberegister 1436 gleich dem Schieberegister 
1435 den gespeicherten Wert urn genau so viele Poaitlonen, wie Glieder in den 
Ketten gelOscht wurdeni in Richtimg des niederwertigen Bits. let nach dieser 
15 Operation der Inhalt eines Schieberegisters gleich Null, da das PBIT aber das 
nlederwertigste Bit hinausgeschoben wurde, bedeutet dies, dass die vorznals 
referenzlerte Konfigxiration gelOscht wurde. 

Liefert 1434 fOr einen eingetroffenen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konfigurationsaufforderung an die Konfigurationseinheit zu 
senden, um die fehlende Konf iguration zu laden oder ggf . auch ein 
Fehlerstatue an die Konfigurationseinheit zu melden. 

Die t)bersetzung der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erfolgend, die einzeln oder gemeinsam angewendet werden 
kdnnen, beispielsweise : 

1. Dekoder entsprechend der Funktion eines 74IiS148 

2. Round-Robin Arbiter (vgl. PACTIO) 

3. Lookup-Tabelle (vgl. PACTIO) 

30 Prinzipiell kann die tJbersetzmg dem in PACTIO beschriebenen Verfahren 
entsprechen (Round-Robin-Arbiter, LOTl) . 

Fehlt eine t)bersetzungsvorschrif t, beispielsweise bei der Anwendung von 
Lookup-Tabellen, ist eine Konfigurationsaufforderung an die 
Konfigurationseinheit zu senden, um die fehlende Konf iguration zu laden oder 
35 ggf. auch ein Fehlerstatus an die Konfigurationseinheit zu melden. 

Eine weitere wesentliche Funktion des Konf igurat ions stacks nach Figur 14 ist 
das Seguenzen tlber Konfigurationen/ was bedingte imd tmbedingte i^rtlnge 
Innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detailliert in Pigur 14b beschrieben. 

Ein Befehlsdekoder (1462) erkennt bedingte tind unbedingte Spriingbefehle in 
Konfigurationsworten (1402) beim Lesen aus dem Speicher 1401. Einem 
Sprungbefehl ist als Konstante die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die vom Befehlsdekoder dekodiert und ausgegebea wird 
(1463) . Je nach Sprungrichtung ist der Wert positiv oder negativ. 
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Welterhln 1st als Konstante eln Vergleicbswert (1469) ndt den eintreffenden 
Triggem oder den Statusflags der PAE, belaplelsweise die ALU-Flags zero, 
carry, negative, overflow, etc. oder die Speicher-Flags full, empty, etc., 
angegeben, in Abh&igigkeit dessen bedingte Sprtinge durchge£tUirt warden. Dlese 
S wlrd an eine Verglelchseinheit 1464 tlbermitbelt, die den Wert mit den Flags 
(1465) und/oder Triggem, die von dem Augang tJbersetzungs- und 
Zuweisungseinrichtung (1437) und/oder direkt von dem Bussystem 0105 stainmen, 
verglichen . 

10 Eine Steuereinheit (1466) generiert in Abhangigkeit des Befehles (bedingter 
Oder unbedingter Sprung » "Type") und des Vergleichsergebnisses die 
Anateuerung ftir den Lesezeiger (1405) wie folgt: 

TZnbedlngter Bpnmgi Generiere 'Set", um neue Adresse nach 1405 zu laden ; 
Bedingter Sprungr Verglelcta. erfiftllt: Generiere "Set", urn neue Adresse nach 
IS 1405 zu laden; 

Bedingter Sprung, Verglelch nieht er£011t: Generiere "Count", urn Adresse des 
nachfolgenden Befehles in 1405 zu berechnen. 

Das Setzen einer neuen Adresse geschieht durch Aufaddieren (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. t)ber einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
1415 generierten Startadresse von Konfigurationen (1461) auswIUilt, wird die 
neue Adress bei Anliegen von "Set" in den Lesepointer 1405 geschrieben. 

25 Die Arbeitsweise des Konfigur at ions tacks nacht die Verwendung von 

Konfigurationseinheiten (CT) wie aus PACTIO und PACT17 bekannt weltgehend 
olsoslet, vielmehr ist eine vertellte, parallele CT durch die 
Konfigurations stacks entstanden. 

Zwei Aufgaben der CT kOnnen dabei. jedoch bei einer solchen Einheit 
30 verbleiben: 

1. Das Laden der Konf iguratlonen aus einem Speicher, der chipintem oder 
-extern in^lementiert sein kann, als fltlchtiger oder nicht fltichtiger 
(ROM, EPROM, EEPROM, Plash-ROM, etc) Speicher ausgestaltet sein kann 

35 imd/oder eln Miassenspeicher sein kazm. Dies kann nunmehr diirch einen 

einfachen Mikrokontroller erfolgen, der Daten an die PAEs sendet und 
auf die zurUckgemeldete Quittierung reagiert. Beispielsweise kann 
bevorzugt die Einheit aus PACT05 als Mikrokontroller bzw. der in 
PACT05 beschriebene Algorithmus eingesetzt werden. Das Laden xnufi nicht 

40 xnehr zwingend aktiv geschehen, sondem es ist ausreichend, wenn eine 

Einheit vorhanden ist, die auf das Konf igurationsanforderungskomraando 
das Hereinholen der neuen Konfigurationsdaten in die jeweilige PAE 
bzw. deren zugeordneten Konfigurations speicher veranlasst. Dies kann. 
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etwa bei den vorstehend dlskutlerten I/O-PAEs auch jene PAB selbst 
seln, die derzeit neue Ron£lgurationsdaten benatigt, 

2. Die verbleibende Restelnheit kann verwendet werden, um 

5 sicherzustellen, dass Rekonfigurations trigger (WCT) in einer 

bestlmmten Reihenfolge sortierb diirch das Array laufen und/oder 
vorgeladene Konf igurationen in der erforderlichen Reihenfolge 
abgearbeitet warden und/oder noch nicht geladene, aber ben&tigte 
Konf igurationen wie erforderlicb angefordert und /oder geladen warden, 

10 Diese Rekonfigurationstriggerpriorisierung kann dazu verwendet warden, 

zu Priorisieren, auf welchen Rekonf igurationsanforderungstrigger 
zuerst reagiert werden soli. Dies stellt die konfliktfreie Abarbeitting 
unterschiedlicher, m&glicher Konf igurationen eicher, indem lediglich 
festgelegt wird, welcher Trigger zunSchst durch das Array ISuft. Wenn 

15 ein solcher Trigger eine bestiaunte PAE betrifft, die auf diesen 

Trigger reagieren soli, wird sie sich dies merken, um dann als 
ndchstes auf diesen Trigger reagieren zu kOnnen, sobald sie 
rekonfiguierbar ist. Es sei erwflhnt, dass bevorzugt die einzelne Zelle 
Oder ein Zellgebilde oder dergl. nicht nur Jene Trigger vormerkt, die 

20 unioittelbar nachfolgend abzuarbeitende Konfigurationen betreffen, 

sondem dass auch alle weiteren oder wenigstens mehrere, von dieser 
Zelle kOnftig abzuarbeitenden Konfigurationen in ibrer Reihenfolge 
abgelegt werden kOnnen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erhait land behait, 

25 die sie zukUnftig und/oder aktuell betrifft. Damit wird die Filmo- 

Funktion der frOheren CT Qberflflssig und durch den Zeitverlauf der 
Triggervektoren im wesentlichen ersetzt. 

3. Sofem nur ein Rekonfigurations trigger verwendet wird, sind keine 
30 besonderen HaSnahmen erf orderlich . Wenn mehrere 

Rekonfigurations trigger (WCT) auftreten kOnnen, mUssen diese ohne 
zeitliche tJberlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array laufen, um Deadlocks zu verhindem. 

35 Die kann durch das in Figur 16 dargestellte Verfahren sichergestellt werden, 
bei welchen durch Routing-Mcifinahmen fQr eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Xnstanz (1603) werden mehrere WCT fOr 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entfemungen der 1601 in der 

40 Matrix fOhren zu unterschiedlichen Ijaufzeiten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Bei spiel durch das geeignete Blnsetzen von Pipelinestuf en 
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(1602) durch den, dem Compiler zugeordneten Router, errelcht {vgl. PACT13) . 
Die sich dadurch ergebenden Latenzen sind mit dl-d5 angegeben. Bs ist 
ersichtlich, daS in Richtvmg des WCT-Flusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auftreten. Beispielsweise ware 1605 nicht notwendig, da 
5 die Entfemung von 1606 von 1603 sehr gering ist. Da aber £0r 1607 und 1608 
je ein 1602 aufgrund der durch die l&igere Distanz entstehenden Laufzeit 
eingefUgt werden m\X&, wird 1605 zum Al^gleich der Laufzeit notwendig. 
Die zentrale Instanz 1603 ninnnt von den PAEs eingehende 

Rekonfigurationstrigger (1609) au£ und priorisiert diese, urn sie dann jeweils 
10 einzeln void nacheinander als WCT an das Array aus PAEs zu senden. Mit 

anderen Worten sendet eine PAE, die einen Rekonfigurations trigger generiert, 
diesen nicht direkt an andere PAEs weiter, sondem axisschliefilich an die 
zentrale Instanz 1603. 



15 Die zentrale Instanz speichert eingehende Trigger \ind priorisiert diese. Dazu 
kann bevorzugt das aus PACTlO belcannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Figur 8 PACTlO ausftlhrlich beschrieben 1st. 
Sdmtliche erwSLhnten PACT-Schutzrechte sind zu Of fenbarungszwecken 
vollumfanglich eingegliedert . 
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Titel: 
S PatentansprOche 

1. Zellementefeld zur Datenverarbeitung mit Funktionszellen zur AusfUhrung 
algebralscher und/oder logischer Funktionen und Spexcherzellen, urn 
Information zu empfangen, abzuspeichem und/oder auszugeben, dadurch 

10 gekennzeichnet , 6a& von den Funktionszellen eine Steuerverbindung zu den 

Speicherzellen gefCLhrt ist* 

2. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet « 
dafi ein Prozessor, Coprozessor und/oder Microcontroller xtdt einer 

15 Vielzahl in Funktion und/oder Verne tzung rekonf igurierbarer und/oder 

vorgebbarer Einheiten wie Funktionszellen und/oder Speicherzellen bildet. 

3. Zellementefeld nach einem der vorhergehenden AnsprCche, dadurch 
gekennzeichnet, dafi die Funktionszellen als arithmetische Logikeinheiten 

20 gebildet sind. 

4. Zellementefeld nach dem vorhergehenden Anspruch, dadurch gekennzeichnet, 
daS die surithmetischen Logikeinheiten als erweiterte ALUs gebildet sind. 

25 5. Zellementefeld nach einem der vorhergehenden Ansprtlche, dadiirch 

gekexmzeichnet, dafi die Speicherzellen zur flttchtigen und/oder nicht 
flUchtigen Datenspeicherung ausgebildet sind. 

6. Zellementefeld nach einem der vorhergehenden AnsprQche/ dadurch 
30 gekennzeichnet, dafi die Speicherzellen zur Abspeicherung von zu 

verarbeitenden Daten und/oder von zu verarbeitenden Programmschritten 
ausgebildet sind. 

7. Zellementefeld zur Datenverarbeitiing, dadurch gekennzeichnet, dafi die 
35 Speicherzellen dazu ausgebildet sind, abgespeicherte Informationen auf 

Ansteuerung der sie steuemden Funktionszelle direkt und/oder indirekt 
auf einen zur Funktionszelle ftihrenden Bus zu geben. 

8. Zellementefeld nach einem der vorhergehenden Ansprtiche, worin zumindest 
40 einer Speicherzelle und/oder Funktionszelle Register zugeordnet sind, 

insbesondere ein Backward-Register, welches im Xnformationsweg zwischen 
Speicherzelle und Funktionszelle angeordnet ist. 

9. Zellementefeld nach einem der vorhergehenden Ansprtlche, dadurch 

45 gekennzeichnet, da& die Speicherzelle dazu angeordnet ist, infoinnationen 

von der sie steuemden Funktionszelle, einer Eingabe-Ausgabe-Zelle 
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xind/oder elner sle nlcht steuemden ZelXe zciit arithmetischer Logikeinheit 
zu eniipfangen. 

10. Zellementefeld nach einem der vorhergehenden Ansprtlche, dadurch 

5 gekennzeichnet, dafi der Punktionszellen-Spelcherzellen-Kombination 

zumindest ein Ein-Ausgabe-Mittel zugeordnet ist, urn Infonoationen an eine 
exteme Einhelt und/oder eine andere Fiinktionszelle, Funktionszellen- 
Spelcherzellen-Koinblnation und/oder £lpeicherzelle zu senden und/oder von 
dleser zu eropfangen. 

10 

11. Zellementefeld nach deia vorhergehenden Anspruch, dadurch gekennzelchnet, 
dafi das Ein-Ausgabe-Kl btel glelchfalls zum Baptang von Steuerbef ehlen 
aus der Funktionszelle ausgebildet ist. 

Zellementefeld nach einem der vorhergehenden Anepjrtiche, dadurch 
gekennzeichnet, dafi die Steuerung dazu ausgebildet ist, zumindest 
einige, bevorzugt alle der nachfolgenden Befehle zu fiber tragen und/oder 
die )Speicherzelle bzw. Eingabe/Ausgabe-Zelle dazu ausgebildet ist, die 
folgenden Befehle zu dekodieren: DATA WRITE/READ, ADRESSPOXNTER 
WRITE/READ, PROGRAMMPOINTER WRITE/READ, PROORAKMPOIMTER IlKZREMENT, 
STACKPOINTER WRITE/READ, vorgenannte Befehle jeweils insbesondere fOr 
intemen und/oder extemen Zugriff , PUSH, POP, OPCODE, FETCH. 

Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 
gekennzeichnet, dafi die Funktionszelle als alleiniger Master auf die 
Steuerverbindung und/oder das ale Steuerungsverbindimg dienende 
Bussegment zugreifen kemn. 



15 12. 



20 




14. Zellementefeld zur Datenverarbeitung nach einem der vorhergehenden 
30 AnsprUche, dadurch gekennzeichnet, dafi die Funktionszelle zumindest 

einer von Speicherzelle und Ein«-Ausgabezelle benachbart emgeordnet ist. 



15, Zellementefeld nach einem der vorhergehenden AnsprQche, dadurch 
gekennzeichnet, dafi die Zellelemente multidimensional angeordnet sind, 

35 insbesondere matrixartig, wobei die Funktionszelle und/oder die 

benachbarte Speicher- bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten 
empfangen und in eine untere Reihe Daten ausgeben kann, wobei in einer 
Reihe Busse vorgesehen sind und die Funktionszelle und zumindest eine 
Speicher- und/oder Bin-Ausgabezelle in ein und derselben Reihe llegen. 

40 

16. Verfahren zum Betrieb eines Zellelementefeldesi insbesondere 
multidimensional en Zellelementefeldes mit Funktionszellen zur Ausffihrung 
algebraischer und/oder logischer Funktionen und 

Xnformationsbereitstellungszellen, insbesondere Spelcherzellen tahd/oder 
45 Ein-Ausgabezellen zum Empfangen und/oder Ausgeben von Informationen 

und/oder Speichem derselben, dadurch gekennzeichnet, dafi zumindest eine 
der Funktionszellen Steuerbefehle an z\uaindest eine 
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Inforrnationsbereitstel lungs z el le ausgibt, dort iiu Ansprechen auf die 
Steuerbefehlinformation ftir die Funktionszelle verarbeltet wird und die 
Punktionszelle dazu ausgebildet ist, eine weitere Datenverarbeitiing im 
Ansprechen auf aus der Informationsbereitstellungszelie bereitgestellte 
5 Information durchzuftihrenr urn so seguenzerartig Da ten zu verarbeiten. 

17. Verfahren nach einem der vorhergehenden Ansprtiche, dadurch 

gekennzeichnet^ dafi die Funktionszelle dazu ausgebildet ist, ztunindest 

einige der Steuerbefehle 
10 OPCODE FETCH, 

DATA WRITE INTERN, 

DATA WRITE EXTERN, 

DATA READ INTERN, 

DATA READ EXTERN, 
15 ADRESSPOINTER WRITE INTERN, 

ADRESSPOINTER WRITE EXTERN, 

ADRESSPOINTER READ INTERN, 

ADRESSPOINTER READ EXTERN, 

PROGRAMMPOINTER WRITE INTERN, 
20 PROGStANMPOINTER WRITE EXTERN, 

PROGRAMMPOINTER READ INTERN, 

PROGRAMMPOINTER READ EXTERN, 

STACKPOINTER WRITE INTERN, 

STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 

PUSH, 

POP, 

PROGRAMMPOINTER INCREMENT 
30 ausgibt und im Laufe Zellementbetriebs zumindest einige, insbesondere 

alle der oben genannten Steuerbefehle wie erforderlich ausgibt. 



18. Datenverarbeitungsanordnung mit einem multidimensional en 
35 Feld 

in Funktion und/oder Verne tzung konf ig\irierbarer Zellelemente und 
diesen zugeordneten KonfigurationsvorhaltemitteIn zum lokalen 
Konf igurations-Vorhal ten, 
dadurch g e k e n n z e i c h n e t , daS 
40 die Konf igurationsvorhaltemittel dazu ausgebildet sind, 

zumindest einen Tail der vorgehaltenen Konfigurationen 
nichtfiachtig vorzuhalten. 

19. Datenverarbeitungsanordnxing mit einem nultidimensionalen 
45 Feld 

in Funktion und/oder Vemetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konfiguratlonsvorhaltemitteln zum lo3calen 
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Konf igurat ions -Vorhal ten , 
dadurch g e k enn z e 1 c hn e t , dafi 
die Xonfigiirationsvorhaltemittel dazu ausgebildet aind, 
alle vorgehaltenen Konf igurat ionen 
S nichtfltichtig vorzuhalten. 

20. Datenveraurbeitungsanordnung nach einem der vorhergehenden 
DatenverarbeitungsanordnimgsansprQcher dadiircta gekennzeichnet, dafi die 
Punktion gro]t>granular konfigiirierbar ist. 

10 

21. Datenverarbeitungsanordnxing nach einem der vorhergehenden 
Datenverarbeitungsanordniingsansprttche, dadurch gekennzeichnet, daS die 
Vemetzung grolDgranular konfigurierbar ist. 

IS 22. Datenverarbeitungsanordnung nach einem der vorhergehenden 

DatenveraLrbeitungsanordnungsansprilche, dadurch gekennzeichnet, daiS slLs 
Zellelemente zumindest eines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
IiogiblOcken vorgesehen sind. 

20 23. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenvereirbeitungsanordnungsansprttche, dadurch gekennzeichnet, dafi jedem 
Zellelement ein eigenes Konf igurations vorhal temitt el zugeordnet ist. 

24. Datenverarbeitimgsanordnung nach einem der vorhergehenden 

75 Datenverarbeitungsanordnungsansprtlche, dadurch gekennzeichnet, dafi die 

Konfigurationsvorhaltemittel dazu ausgebildet sind, eine Vielzahl von 
Konfigurationen vorzuhalten. 

25. Datenverarbeitungsanordnung nach einem der vorhergehenden 

30 Datenverarbeitungsanordnungsansprtiche, dadurch gekennzeichnet, dafi 

mehrere fest vorgegebene nichtflUchtige Konfigurationen im 
Konfigurationsvorhaltemittel vorgegeben sind. 

26. Datenverarbeitungsanordnung nach einem der vorhergehenden 

35 Datenverarbeitungsanordnungsansprdche, dadurch gekennzeichnet, dafi die 

Anordnung dazu ausgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konfigurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonfiguration Oder des lokalen Sequencing. 

40 27. Datenverarbeitungsanordnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprtlche, dadurch gekennzeichnet, daS bei 
einlgen Zellen im Betrieb mit ver&iderlichen Konfigurationen versehbare 
Konfigurationsvorhaltemittel vorgesehen sind. 

45 28. Datenverarbeitungsanordnung nach einem der vorhergehenden 

DatenverarbeitungsanordnungsanspirUche, dadurch gekennzeichnet, dafi als 
Konfigurationsvorhaltemittel zunioindest eines aus ROK, EFROM, EEPROM, 
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Flash- Spei Cher, Fuse-, Antifuse-prograinmierbare Speichexmittel und/oder 
in Insbesondere in oberen Lagen einer Siliziumstrukkur feat vx>rge6ehene 
Speichermittel gew£Uilt sind. 

5 29. Verfahren zur Heretellimg einer dedizierten 

Datenverarbeitungsanordnung, dadurch gekennzeichnet, daS ein 
multidimensional es Feld mit in Funktion und/oder Verne tzung 
konfigxirierbaren Zellelemente und diesen zugeordneten 
Konfigurationsvorhaltemitteln zum lokalen Konf igurations-Vorhalten 

10 vorgegeben wird, bestimmt wird, welche Konfigurationen in diesen 

vorzuhalten sind, und dann nichtflttchtige Konfigurationsvorhaltemittel 
so vorgesehen verden, da& sie zumindest einen Teil der vorgehaltenen 
Konfigurationen nichtflUchtig vorhalten. 



15 30. Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
dadurch gekennzeichnet, dafi von einem zur lauf zeitrekonf igurierbaren 
multidimensionalen Feld ausgegangen wird. 

31. Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
20 dadurch gekennzeichnet, daS zunSchst von einem zur 

laufzeitrekonfigurierbaren multidimensionalen Feld mit 
Rekonfigurationsbeschaltung ausgegangen wird und dann fOr 
Rekonfiguration nichtbendtigte Felder weggelassen warden. 

32. Datenverarbeitungsanordnung, insbesondere nach einem der vorhergehenden 
25 AnsprUche, insbesondere Prozessor, mit einem Feld aus zur Laufzeit in 

Funktion und/oder Vemetzung datenverabeitenden rekonfigurierbaren 
Zellen, denen Speicher und eine Sequenzersteuerung zugeordnet ist, 
dadurch gekennzeichnet, daS die Steuenmg derart ausgebildet ist, daS 
sich ein vollst&idiger und/oder limitierter Befehssatz ergibt. 

30 

.V i' 

33. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprtiche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vemetzung datenverabeitenden 

35 rekonfigurierbaren Zellen, mit einer ALU oder anderen logischen 

Verkntipfungsbeschaltung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadurch gekennzeichnet, dafi der Speicher in 
einer anderen Ualbleiter-Lage, insbesondere oberhalb der ALU oder 
anderen logischen Verkntipfungsbeschaltung angeordnet ist. 

40 

34. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden AnsprCche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vemetzung datenverabeitenden 
rekonfigurierbaren Zellen, von denen einige Speicherzwecken dienen, 

45 dadurch gekeimzeichnet, daS diese Zellen dazu ausgebildet sind, eine 

HMD und/oder DMA - Funktion zu realisieren. 
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35. Datenverarbeitxingsanordnung, Insbesondere nach einem der 

vorhergehenden Aneprtiche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion iind/oder Vemetzung datenverabeitenden 
5 rekonfigurierbaren Zellen, dadurch gekennzeichnet, daS wenigstens 

eine, bevorzugt zumindest einige, insbesondere bevorzugt nicht allO/ 
Zellen eine Eingcings/Ausgangs funktion realisieren und bevorzugt 
zugleich eine ALU oder anderen logischen Verkntlpfungsbeschaltung z\ir 
Datenverarbeitung und/oder -verSnderung aufweisen, wobei insbesondere 
10 Mitt el vorgesehen sind, um jedem EinganGs- und/oder Ausgangskanal eine 

definierte Adresse zuzuordneni tmd/oder wobei 
Senderidentifkationsmittel vorgesehen sind. 



36. Datenverarbeitungsanordnung, insbesondere nach einem der 

15 vorhergehenden Ansprtiche, insbesondere Prozessor, mit einem Feld aus 

zur Lauf zeit in Funktion und/oder Vemetzung datenverabeitenden 
rekonfigurierbaren Zellen, dadurch gekennzeichnet, dafi zumindest 
einige/ bevorzugt nicht alle, Zellen f eingranulare FPGA-Strukturen 
aufweisen, wahrend andere Zellen grobgranulare Strukturen aufweisen. 

20 

37. Datenverarbeitiingsanordnung nach dem vorhergehenden Anspruch, wobei 
eine Konfigurationseinheit zur scbnellen Rekonfiguration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, daS die Konfigurationseinheit 
nur zur Konf iguration der grobgranularen und/oder der Nicht-FPGA- 

25 Zellen beschaltet ist. 

38. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden AnsprUche, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vemetzung datenverabeitenden 

30 rekonf ig\irierbaren Zellen zur Verarbeitimg von Da ten mit einer hdheren 

Bitbreite, dadurch gekennzeichnet, d&Z die Zellen dazu ausgebildet 
sind, wahlweise Daten mit einer hOheren Bitbreite oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan verarbeitbar sind, insbesondere nach Art 

35 eines smo-Rechenwerkes • 



Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprtiche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, daS zur Zelle bin oder von dieser weg ftihrende Busse 
teilbar sind, insbesondere um mehrere DatenstrOme mit geringerer 
Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabhangig weiterleiten und/oder eiiipfangen zu kOnnen. 

40. Datenverarbeitxmgsanordnung, insbesondere nach einen der 
45 vorhergehenden AnsprUche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, daS die Busverwaltimg lokal in der Zelle erfolgt. 



39. 

40 
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41. Datenverarbeltimgsanordnung insbesondere nach elnem der vorhergehenden 
Ansprflche, dadurch gekennzeichnet, daS elner PAE eln spelcher zur 
Sequenzerrealislerung zugeordnet iat und die Adressbiisse als 
Teiladresbusse aufteilbar slnd. 

5 

42. Datenverarbeitimgsanordnung inabesondere nach einem der vorhergehenden 
Ansprtiche/ dadurch gekennzeichnet, daS elner PAB eln Spelcher ztir 
Sequenzerrealislerung zugeordnet ist und eine Anordnung vorgesehen 

10 ist, urn bel Zugrl££ au£ eine Spelchers telle sowohl Informationen 

betreffend die AdresBe elner Spelcherstelle fOr den nachsten 
Speicherzugriff zu bestlnmen als auch Daten und/oder Befehle zu 
erxnitteln. 

15 
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